惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

Exploit-DB.com RSS Feed
Exploit-DB.com RSS Feed
Cisco Talos Blog
Cisco Talos Blog
T
Threat Research - Cisco Blogs
P
Privacy International News Feed
S
Schneier on Security
P
Privacy & Cybersecurity Law Blog
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
云风的 BLOG
云风的 BLOG
P
Proofpoint News Feed
Scott Helme
Scott Helme
人人都是产品经理
人人都是产品经理
G
GRAHAM CLULEY
O
OpenAI News
CTFtime.org: upcoming CTF events
CTFtime.org: upcoming CTF events
PCI Perspectives
PCI Perspectives
GbyAI
GbyAI
宝玉的分享
宝玉的分享
Y
Y Combinator Blog
T
Troy Hunt's Blog
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
C
CXSECURITY Database RSS Feed - CXSecurity.com
腾讯CDC
C
Check Point Blog
Spread Privacy
Spread Privacy
L
LINUX DO - 最新话题
Recent Announcements
Recent Announcements
大猫的无限游戏
大猫的无限游戏
P
Palo Alto Networks Blog
Hacker News: Ask HN
Hacker News: Ask HN
M
MIT News - Artificial intelligence
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
The Hacker News
The Hacker News
H
Hacker News: Front Page
Microsoft Azure Blog
Microsoft Azure Blog
I
InfoQ
T
Tor Project blog
Martin Fowler
Martin Fowler
博客园 - 叶小钗
罗磊的独立博客
C
Cyber Attacks, Cyber Crime and Cyber Security
H
Heimdal Security Blog
V
Vulnerabilities – Threatpost
Simon Willison's Weblog
Simon Willison's Weblog
Latest news
Latest news
WordPress大学
WordPress大学
G
Google Developers Blog
N
Netflix TechBlog - Medium
S
Security Affairs
S
Secure Thoughts
Know Your Adversary
Know Your Adversary

博客园_首页

Linux实操--组管理、权限管理和定时任务 Java + EasyExcel 实现单个接口导出多个Excel Mem0 源码解析系列(二):提示词工程的深度剖析 Openclaw TaskFlow究竟是什么?和普通Skill技能有什么区别 博文阅读密码验证 - 博客园 嘉立创开源:应该是全网MicroPython教程最多的开发板 Hermes Agent 集成实践:从协议到生产 2026年AI编程工具横评:Cursor、Codex、Claude Code、Zed、Windsurf Java程序员必看的RAG入门教程 2026 AI效率神器:Superpowers + Claude Code 保姆级教程 本地大模型部署全攻略:从 0 到 1 玩转 Ollama 【从0到1构建一个ClaudeAgent】内存管理-上下文压缩 .NET 高级开发 | 设计、实现一个事件总线框架 电子小白入门之NE555 3. WorkBuddy:隐藏玩法,一键召唤专家,让 AI 以"专家身份"给你干活 和AI一起搞事情#3:Claude Teammate 游戏开发翻车实录 【OpenClaw】通过 Nanobot 源码学习架构---(7)Memory C# .NET 周刊|2026年3月3期 我在 Debian 11 上把 K8s 单机搭起来了,过程没你想的那么顺(/opt 目录版) 深度学习进阶(七)Data-efficient Image Transformer CLI+Skill搭建浏览器AI自动化框架,告别一切重复枯燥任务 告别Token账单无底洞:OpenClaw本地部署,重塑企业数据主权的唯一解 FastAPI+Vue:文件分片上传+秒传+断点续传,这坑我帮你踩平了! SBTI 爆火后,我做了个程序员版的 CBTI。。已开源 + 附开发过程 多模态检索开始进入工程期:用 Sentence Transformers 搭建可落地的 Multimodal RAG 100多行代码实现一个最简单的Agent(用ReAct) Claude Code 通关手册(八):推荐 5 个 Hooks,代码质量提升 3 倍 老板:“有人截图了!”。安全部门:“收到,马上查暗水印!” - why技术 技术之外,皆是人间 C#/.NET/.NET Core技术前沿周刊 | 第 69 期(2026年4.01-4.12) Snack JSONPath 项目架构分析 Claude Code Buddy 小析:一个非核心功能,如何体现产品的细节完成度 AI新时代下的图床管理方案-Cloudflare图床+MCP+Skills方案指南 化繁为简:顺丰速运App如何通过 HarmonyOS SDK实现专业级空间测量 从零实现富文本编辑器#13-React非编辑节点的内容渲染 AI开发-python-langchain框架(3-23-OpenAI Functions风格Tool Calling智能助手) .NET + AI 进阶实战:基于类的技能开发 - 打造可治理的 Agent 能力模块 【从0到1构建一个ClaudeAgent】规划与协调-技能 上周热点回顾(4.6-4.12) 电子小白的工具三件套:面包板、杜邦线、万能板 单表五亿数据的查询优化 | Mysql、StarRocks 2. WorkBuddy:从“我是谁”到“帮我干活” C# 如何减少代码运行时间:7 个实战技巧 基于HelixToolkit.SharpDX 渲染3D模型 - 笺上知微 从零开始的双臂具身VLA起源及现阶段发展综述 - SkyXZ 记对 xonsh shell 的使用, 脚本编写, 迁移及调优 - pluvium27 受够了Vibe Coding的失控?换个起点,让AI事半功倍 从开始配置漏洞环境到漏洞复现流程 - 難しい 关于10年工作经验的程序员对OpenClaw的实战经验分享以及看法 - 虚无境 Any metadata 的内存布局 C# .NET 周刊|2026年3月2期 - InCerry 我帮你测过了,测试圈排名第二的 Skill 依然很牛逼 Skill Discovery | 无监督技能发现的经典工作总结 - MoonOut PbootCMS 网站内容数量多导致访问慢?这些实用优化方案帮你提速! - 家兴网络技术工作室 上下文工程是什么?过时了么?一文讲明白! - 一枫说码 网站漏洞怎么发现并修复?一篇实用指南(附完整流程) - 家兴网络技术工作室 开了 TUN 模式还是直连?90% 的人都踩过这个坑 Github日报|2026年04月12日 - AI一族 AScript扩展多种脚本语言 - rockey627 AI 学习笔记:Agent 的记忆机制 你能被装进一个文件里吗?——7 万人把同事"蒸馏"成了 AI - 我没有三颗心脏 Claude Code 通关手册(七):给 AI 装上技能包——Skills 完全指南 - 暮色之狐 在浏览器中快速编辑代码:VSCode Web 集成实践 - Newbe36524 蒸馏自己 skill?基于 Deepseek 的蒸馏器,丐版蒸馏方式,简单便捷 - To_Carpe_Diem Spring AI Aliababa和AgentScope,哪个更好? - 苏三说技术 Etsy 把 1000 个 MySQL 分片迁进 Vitess:425TB 数据背后的真正问题不是性能,而是运维规模 MicroPython LVGL基础知识和概念:底层渲染与性能优化 - FreakStudio 数据库草图算法 Python 潮流周刊#146:CPython 引入 Rust 的进展 - 豌豆花下猫 最小生成树 - mofei1116 红日靶场七:从外网入口、容器逃逸到 AD 接管的完整利用链复盘 - YouDiscovered1t 分享四款开源且实用的 Kafka 管理工具 - 追逐时光者 vLLM 权重加载机制全解析:从挑战到理想架构 LCT 学习笔记 - ACehomoxue Avalonia UI 12.0.0 正式发布:架构演进和性能飞跃 - 张善友 当 AI Agent 把调用链拉长,延迟开始成为一门生意 conhost.exe 无法显示 U+2717 - 145a 太秀了,我把自己蒸馏成了 Skill!已开源 - 程序员鱼皮 ASP.NET Core 内存缓存实战:一篇搞懂该怎么配、怎么避坑 基于 Ghostty 带有分割标签页和为 Claude 编程设计的通知终端 - BugShare AI 焊死入口:教育的“操作系统级”重塑 - 郝hai 初级Java开发工程师使用sql脚本编写代码的过程是简单而且不糊涂 - CoderOilStation Claude Code通关手册(六):MCP协议完全指南 - 暮色之狐 边框灯光环绕动画特效实现指南 - Newbe36524 开源:子木蒸馏版的 SEO 审计工具 seo-audit-skill v1.0 我所理解的Python元模型 【从0到1构建一个ClaudeAgent】规划与协调-TodoWrite - 程序员Seven Claude 和 Codex 在审计 Skill 上性能差异探究 - ACai_sec AScript如何实现中文脚本引擎 - rockey627 【渗透测试】HTB Season10 Garfield 全过程wp - dynasty_chenzi Android 开发者为什么必须掌握 AI 能力?端侧视角下的技术变革 树状数组正确性证明 - AC-wyr 你的 AI 焦虑,可能比 AI 本身更危险——ATM 机没有消灭银行柜员,但恐慌消灭了你的判断力 - 我没有三颗心脏 一个拉胯的分库分表方案有多绝望?整个部门都在救火! - 冰河团队 动态规划入门必学之走方格问题 - Ofnoname PostgREST 与 PostgreSQL 角色权限配置全解析(生产级实践) - SheepDog1998 使用 UEFI 图形输出协议 GOP 在屏幕上显示图像的方法 - 阿源- Claude Code通关手册(五):组建你的AI专家团队,子代理系统 - 暮色之狐 一个程序员到架构师的催婚路之感悟(整整10年后的催婚相亲感悟) - MisterLip 用 Agent Skill 自动生成工作周报 - 赵康
从 OpenClaw.NET 的 /loop 实现,看 Loop Engineering 如何从概念走向工程实践
张善友 · 2026-06-20 · via 博客园_首页

一、引言

Loop Engineering 这个词最近又热起来了。

如果你从去年开始关注 AI 工程化领域的动态,大概已经习惯了这种概念迭代的节奏——Prompt Engineering 还没完全消化,Context Engineering 就登场了;Harness Engineering 的论文刚存进收藏夹,Loop Engineering 又冒了出来。新概念一个接一个,快得让人应接不暇。

这难免让人心里打鼓:Loop Engineering 是真有价值,还是又一轮概念炒作?

我的看法是,判断一个新概念是不是噱头,最好的方式不是争论定义,而是去看真实的工程实现。一个概念如果能经得起代码的检验——有人愿意写、有人愿意 review、有测试覆盖、能合并进主干——那它至少解决了一个真实存在的问题。

OpenClaw.NET 刚合并的/loop 命令(PR #156),恰好提供了这样一个检验样本。

这个 PR 由 geffzhang 贡献,灵感来自 OpenAI Codex 的 /loop 原语。它用 1,033 行代码实现了一个完整的定时循环提示词注入系统,涉及 11 个文件,62 个测试全部通过。用户可以输入类似 /loop 5m check CI status 的命令,系统就会每 5 分钟自动注入提示词,驱动 Agent 持续执行任务,直到满足终止条件。

这不是概念验证,是生产级的实现。

这篇文章就想借这个 PR,把 Loop Engineering 的技术本质拆开来看,聊聊它在研发平台里到底该放在什么位置,以及为什么它比表面看起来更值得关注。


二、Loop Engineering 是什么

Loop Engineering 的核心,是回答一个问题:怎么让 AI Agent 持续、自主、可控地运行?

传统的 LLM 调用是"一问一答"模式——你发一条消息,模型回复,对话结束。Agent 稍微进了一步,模型可以在一次调用里决定"我要用工具",执行完再把结果塞回上下文继续推理。但本质上,模型还是被动地等你的输入。

Loop Engineering 要做的,是把模型放进一个你设计好的循环里,让它自己跑起来。

Agent Loop 的核心机制

一个典型的 Agent Loop 长这样:

Thought → Action → Observation → Thought → ...

模型先思考当前该做什么(Thought),然后执行动作比如调用工具或写代码(Action),接着观察执行结果(Observation),再基于观察继续思考下一步……这个循环自主运转,直到满足某个终止条件才停下来。

模型不再是被动等指令的聊天机器人,而是你设计的循环里的一个自主参与者。你定义循环的规则、工具和终止条件,模型在规则范围内自己做决策。

演进脉络

这个思路不是凭空冒出来的,它有一条清晰的演进线:

  • ReAct(2022):Yao 等人提出推理与行动交替的框架,奠定了"思考→行动→观察"的基本模式,但当时是单步推理,没有持续循环的概念。

  • AutoGPT(2023):把循环跑起来了,Agent 全自主决策、自主执行。问题是太容易失控——目标漂移、无限循环、账单爆炸,热度来得快去得也快。

  • Agent SDK 时代(2025):Claude SDK、OpenAI Agent SDK 等提供了结构化的循环框架,开发者可以编排 Agent 的执行流程,但循环的驱动力还是单次用户请求。

  • Loop Engineering(2026):声明式目标 + 自动循环触发。人负责设计 loop 的结构(什么时候触发、用什么工具、怎么判断完成),AI 负责在 loop 里自主运行。人和机器的职责第一次被清晰地分开了。

Loop 的本质:一个公式

如果把 Loop 的本质压缩成一句话,大概是:

Loop = Cron(定时触发) + 决策器(判断下一步做什么)

Cron 负责"什么时候推进下一轮",决策器(就是 LLM)负责"这一轮该做什么"。模型变成了你程序里的一个子程序,而你变成了这个循环的作者——你写主循环,模型跑子程序。

概念层级链

把 Loop Engineering 放到更大的图景里看,AI 工程化经历了这样一层层的能力堆叠:

Prompt Engineering(怎么跟模型说话)
Harness Engineering(怎么给模型造一个稳定的运行环境)
Loop Engineering(怎么让这个运行环境自己跑起来)
Factory Model(怎么让多个 loop 协同起来产出完整的软件)

每一层都建立在前一层的基础之上。没有 Harness 的隔离和工具调用能力,Loop 就无从谈起;没有 Loop 的持续运转能力,Factory 级别的多 Agent 协作也只是纸上谈兵。

六大原语

Addy Osmani 在梳理 Loop Engineering 时总结了六个核心原语,可以作为设计一个 loop 的 checklist:

原语 作用
指令(Instruction) Loop 要达成的目标,声明式描述
工具(Tools) Loop 里模型能调用的能力集
上下文(Context) 每轮注入的 prompt 和运行时信息
记忆(Memory) 跨轮次的状态积累和知识沉淀
终止(Termination) 判断 loop 什么时候该停下来
评估(Evaluation) 每轮执行结果的校验和反馈机制

这六个原语听起来抽象,但你在接下来的 /loop 实现里,每一个都能找到对应的工程决策。概念和代码之间,其实只隔了一层窗户纸。


三、解剖 OpenClaw.NET 的 /loop 命令

概念聊完了,来看代码。geffzhang 的 PR #156 把 Loop Engineering 的六个原语落到了实处,其中几个设计决策尤其值得细品。

PR #156 概览

这个实现的核心能力很直观:用户在聊天界面输入 /loop 5m check CI status,系统注册一个定时循环,每 5 分钟向指定 session 注入一次系统消息,驱动 Agent 检查 CI 状态并汇报。Agent 可以自主决定任务已完成(调用 loop_control 工具),也可以由系统根据语义关键词强制终止。

1,033 行代码,11 个文件变更,62 个单元测试。体量不算大,但设计密度很高。


四大核心设计决策

1. TickerQ 混合调度:编译期声明 + 运行时注册表

这是整个实现的地基,也是最需要权衡的地方。

OpenClaw.NET 的调度底层用的是 TickerQ 10.4.0,这个版本有个特点:只支持编译期的 cron 表达式,不暴露动态注册接口。也就是说,你不能在运行时说"给我新建一个每 5 分钟执行一次的任务",只能在代码里写死 [TickerFunction("AgentLoopExecutor", "* * * * ")],编译后就定了。

/loop 命令显然需要动态创建定时任务——用户随时可能发起一个新的循环,间隔也各不相同。

PR 采用的方案是混合调度:编译期挂一个每分钟 tick 一次的定时器作为"心跳",运行时维护一个 ConcurrentDictionary<string, LoopEntry> 内存注册表,记录每个活跃 loop 的下一次触发时间和间隔。每次 tick 到来时,扫描注册表里哪些 loop 该执行了,把到期的推进一轮。

这个方案的优点是简洁且可靠——没有魔改 TickerQ,没有引入新的调度依赖,ConcurrentDictionary 的线程安全性也经过了充分验证。代价是多了一层内存中的轮询逻辑,但对于分钟级精度的场景完全够用。

2. 零入侵 AgentRuntime:借助现有管道注入

这是一个非常干净的设计决策。

Loop 的提示词不是直接往模型里塞,而是通过 MessagePipeline.InboundWriterChannelId="cron" 的系统消息注入。这条消息会进入和正常用户消息完全相同的投递管道,由已有的 GatewayInboundMessageWorker 消费、转发给 AgentRuntime。

AgentRuntime 一行代码都不用改。

这个设计的高明之处在于解耦。Loop 模块不依赖 AgentRuntime 的内部实现,只复用现有的消息基础设施。这意味着无论是当前的 AgentRuntime,还是未来的 MafAgentRuntime,或者其他任何实现了同样消息接口的运行时,/loop 都能直接兼容。

"不修改,只扩展"——这是我在这个 PR 里最喜欢的一个决定。

3. 双层语义自终止:工程教训的产物

终止机制是这个实现里我最想展开聊的部分,因为它直接来自血泪教训。

OpenAI 的 Codex 在早期版本中曾因缺乏有效的终止机制,导致 Agent 在任务完成后继续无意义地运转,日志膨胀到 34GB/天。这不是"理论上可能出问题",是真真切切发生过的事故。

PR #156 采用了双层防御:

主路径:模型主动调用 loop_control(status="complete") 工具,显式声明"我干完了"。这是最干净的终止方式——模型自己知道什么时候该停。

备用路径:检测模型响应文本中的终止关键词,包括 LOOP_TERMINATEDONEWORK_COMPLETE 等。如果模型没用工具但嘴上说了"完成了",系统也能识别并终止循环。

两层机制兜底,避免单点失效。FrozenSet 存储关键词,O(1) 的查找效率。

这套设计说明作者是真的在生产环境里踩过坑——只有被无限循环整过的人,才会在终止条件上如此 paranoid。

4. NativeAOT 全兼容:零反射,零动态代码

如果你是 .NET 开发者,会知道这个 PR 在 NativeAOT 兼容性上花了多少心思。

整个实现零反射、零动态代码生成

  • [GeneratedRegex] 编译期生成正则匹配代码
  • [TickerFunction] 源生成器处理调度声明
  • System.Text.Json 源生成器序列化所有 payloads
  • FrozenSet 存储终止关键词集合,启动时冻结、运行时只读

在 NativeAOT 模式下,反射和动态代码会被编译器裁剪掉,轻则性能下降,重则直接跑不起来。PR 从第一天就规避了这些陷阱,说明作者对部署目标有清晰的认识——这个系统是要打包进容器、启动速度要快、内存占用要低。


状态机设计

/loop 维护了一个精简的三态机:

Scheduled(已注册,等待触发)
    ↓ 定时器到期,注入提示词
Running(正在执行本轮任务)
    ↓ 语义终止触发
Terminated(终态,不可恢复)

围绕这个状态机,有三条关键规则:

幂等覆盖:同一个 session 只能有一个活跃 loop。用户重复发起 /loop 时,新 loop 会覆盖旧 loop。这避免了 session 里堆叠多个循环导致的行为混乱。

非抢占执行:如果某个 session 当前正在处理消息(比如上一轮还没跑完),定时触发的新消息会排队等待,不会强行中断。这是防止 race condition 的关键设计。

静默自毁:当 loop 因语义终止而结束时,系统不会主动发送通知打扰用户。任务完成了就安静地退出,把界面还给用户。这个细节体现了对用户体验的考量——没人喜欢被一个已经没必要的循环反复弹窗。


/goal 的互补关系

/loop 不是 OpenClaw.NET 里唯一的循环原语。平台里还有一个 /goal 命令,两者形成了有趣的互补:

/loop /goal
驱动方式 外部定时器驱动 模型停止时自动续跑
典型场景 持续监控(检查CI、扫描日志、定期代码审查) 一次性目标(修完所有测试、清完所有 lint)
循环节奏 固定间隔 连续推进,不等待

/goal 适合"干到条件满足就结束"的任务——模型推不动了会自动重试,直到达成目标或超出限制。/loop 适合需要等待外部状态变化的场景——每 5 分钟看一眼 CI,不是一直盯着,而是间歇性地检查。

两者独立运作,互不干扰。同一个 session 可以同时拥有 /loop/goal,一个负责定时巡检,一个负责持续推进。这种组合能力让 OpenClaw.NET 的 Agent 系统同时具备了"间歇性监控"和"持续性推进"两种工作模式。

Loop Engineering 的魅力就在于此——它不是给你一个固定的运行方式,而是给你一套组合原语,让你根据场景搭配出合适的自主运行模式。


四、Loop Engineering 不是噱头,但有前提

回到那个更本质的问题:Loop Engineering 在整个 AI 研发平台里,到底算什么级别的存在?

我的判断是:它不是新神坛,而是站在 Harness Engineering 肩膀上的流程控制层。

如前文所述,从 Prompt Engineering 到 Harness Engineering 再到 Loop Engineering,每一层都依赖前一层的基础,不存在谁替代谁。

但这里我必须说一个可能不受欢迎的观点:Loop Engineering 不是银弹,甚至很容易被滥用。

不是什么 Loop 都值得写

如果只是写一个 while (true) 不断调用大模型 API,那不叫 Loop Engineering,那叫自动化烧 token。如果只是给 Agent 丢一句"你自己一直干到完成",没有状态追踪、没有质量门、没有停止条件、没有人工接管点——那叫把不确定性规模化。你本来只是偶尔被模型的幻觉坑一下,现在好了,幻觉被自动化了,24 小时不间断地坑。

Loop Engineering 真正有价值的地方,是把过去人手动反复推动 Agent 的动作,变成可触发、可验证、可追踪、可停止的研发流程。它把人从"反复催促 AI"的重复劳动里解放出来,但前提是——这个流程本身是经过设计的。

五种落地形态

在实际工程里,Loop Engineering 目前呈现出五种形态,成熟度由低到高:

1. 本地短循环

Claude Code 的 /goal 命令是典型代表——改代码→跑测试→看报错→继续修,在个人开发机上循环运行。模型自己发现问题、自己修复、自己验证,干完就停。这种场景上下文相对封闭,失败成本可控,是目前最成熟的落地形态。

2. CI/CD Agent Step

CI 构建失败后,Agent 自动读取日志、生成错误摘要、定位代码、尝试修复、推送 PR。人在关键环节把关,但重复的"失败→分析→修复"循环由 Agent 自主完成。这类 loop 的价值很直接——减少工程师在流水线失败和代码修复之间来回切换的时间损耗。

3. PR Bot / GitHub App

Review→修复→验证→再 review 的循环。代码审查机器人不只是提意见,而是发现 lint 错误、测试缺口或安全漏洞后,直接提交修复建议,跑完验证再通知人类 reviewer 确认。这个模式在代码风格统一、测试补全、依赖升级等"有明确规则"的场景里表现最好。

4. Workflow Engine

长周期任务的编排——状态机、任务队列、事件流、重试策略。一个需求从提出到上线涉及多个角色和环节,每个环节都可能触发 Agent 的自主 loop。这种形态对系统的可靠性和可观测性要求最高。

5. AI First 研发协同平台

需求→设计→开发→测试→发布→复盘的全流程 AI 参与。多个 loop 嵌套协同——需求 loop 触发开发 loop,开发完成触发测试 loop,测试通过触发发布 loop。每个环节都有明确的输入输出契约和人工决策点。

一个场景值不值得做成 Loop,看五个条件

不是所有任务都适合交给 loop。一个场景只有满足下面五个条件,Loop Engineering 才能发挥正面价值:

  • 清晰的触发器:什么事件启动这一轮循环?是定时 tick、上游任务完成、还是外部状态变化?触发条件必须明确且可检测。
  • 可信的上下文:每一轮循环注入的 prompt 和状态信息必须足够让模型做出合理决策。上下文缺失或污染的 loop,跑起来就是灾难。
  • 受控的执行器:模型能调用的工具集、能影响的系统范围,必须有边界。无限制的 Agent loop 等于给了模型一把没有保险栓的枪。
  • 可验证的结果:每一轮循环的产出必须能被检验——代码能编译、测试能跑过、指标能衡量。无法验证结果的 loop 等于黑盒运行。
  • 明确的停止条件:什么时候停?达成目标、超过重试次数、人工干预、还是异常熔断?没有停止条件的 loop 就是无限循环的另一种写法。

五个条件都满足,Loop Engineering 是你的利器。缺一个,就可能把混乱自动化了。


五、范式迁移:从"你催 AI 干活"到"你设计 AI 自主干活"

Loop Engineering 的出现,标志着 AI 工具从"对话助手"向"执行代理"的跃迁。这不是渐进式改良,是工作模式的根本转变。

行业里的两个信号

今年圈子里有两个判断让我印象很深。

一个是 Peter Steinberger 说的:"你不应该再手动 prompt coding agent 了。你应该设计 loop 来 prompt 你的 agent。" 另一个人是 Claude Code 的负责人 Boris Cherny:"我不再 prompt Claude 了。我写 loop 让它们运行。我的工作是写 loop。"

两句话的核心意思一样——人的工作从"跟模型对话"变成了"设计模型的运行规则"。

这跟软件工程的历史有相似之处。早年的程序员直接在机器上写汇编指令,后来进化成写高级语言,再进化成写框架和配置。每一次跃迁,人的工作空间都往上升了一层——离具体执行更远,离结构设计更近。Loop Engineering 正在推动类似的跃迁:人从"代码的作者"变成"循环的作者"。

两条产品路线

Claude Code 和 OpenAI Codex 今年的产品更新,不约而同地指向同一个方向,但路径略有不同。

Claude Code 走的是"评估驱动"路线。/goal 命令背后有一个独立的评估模型,每轮执行后检查终止条件是否满足——测试通过了没?lint 清完了没?错误修完了没?同时推出的 Agent View 提供了一个全屏管理后台,让用户能看到所有正在运行的 Agent 任务、状态和输出。核心理念是"模型自主推进,系统负责校验"。

OpenAI Codex 走的是"触发编排"路线。Automations 支持定时触发 + durable prompt——你写好一套 prompt 和工具配置,设定触发条件,系统到点就自动跑。Triage 模式则是在 Agent 完成初步任务后,把结果推给人工分诊,由人决定下一步走向。核心理念是"规则驱动触发,人工把控关键节点"。

两条路线殊途同归:都在把模型从"被询问的对象"变成"自主运行的节点"。

Anthropic 的内部数据说明了什么

今年 6 月 Anthropic 发布了一篇内部报告《When AI builds itself》,其中几组数据值得关注:

  • Claude 写的代码占当月合并代码总量的比例,在今年 5 月超过了 80%
  • 工程师日均代码合并量相比 2024 年同期增长了 8 倍
  • 开放式任务("帮我完成这个功能"而非"帮我写这行代码")的成功率,从半年前的 26% 提升到了 76%

这些数字背后有两个关键拐点:2025 年初,Claude 从"建议代码"进化到"自己跑代码"——模型不再只输出文本,而是直接执行、观察结果、迭代修复。2026 年初,模型开始能够长时间自主工作——一次任务可能持续几十分钟甚至几小时,期间模型自主决定调用什么工具、重试几次、什么时候放弃。

人的角色在转变

这不是"AI 取代程序员"的末日叙事。现实更微妙,也更值得思考。

你仍然需要理解业务逻辑、设计系统架构、做出工程判断。但你不再需要在"跑测试→等结果→修 bug→再跑测试"这个循环里手动推进每一步。你设计循环的规则——什么条件下启动、用什么工具、怎么判断完成、什么时候让人介入——然后让模型在规则范围内自主运行。

从司机变成调度中心。你不是在循环里催促 AI,你是在循环外设计 AI 的运行规则。问题空间变大了,技能天花板也更高了。


六、结语

写到这里,回到文章开头的问题:Loop Engineering 是真有价值,还是又一轮概念炒作?

我的答案是:它不是噱头,但需要工程约束。 一个没有终止条件的 loop 是灾难,一个有良好设计的 loop 是杠杆。区别不在于概念本身,而在于你愿不愿意回答那五个问题——触发器清楚吗?上下文可信吗?执行器受控吗?结果可验证吗?停止条件明确吗?

OpenClaw.NET 的 PR #156 之所以值得关注,正是因为它把一个正在形成的行业共识变成了可运行的代码。它有状态机,有双层终止机制,有并发安全,有 AOT 兼容。这不是概念验证,是一个生产系统对待 Loop Engineering 的认真态度。

给正在考虑引入 Loop Engineering 的开发者一个实在的建议:不要追概念,从实际场景出发。 先看看你的 workflow 里有没有人在反复做"同样结构、不同内容"的事情——检查 CI、跑测试、补全代码、审查 PR。如果有,再问那五个问题。五个答案都有了,Loop Engineering 就是你的利器。

这不是 AI 取代人,而是人的工作空间从代码层上升到了编排层——你掌控的范围更大了,设计的权重也更高了。

Loop Engineering 不是终局,只是下一层台阶。 但站上去看,视野已经不同了。


参考链接

  1. OpenClaw.NET PR #156 — Loop: https://github.com/clawdotnet/openclaw.net/pull/156
  2. OpenClaw.NET 仓库: https://github.com/clawdotnet/openclaw.net
  3. When AI builds itself: https://www.anthropic.com/institute/recursive-self-improvement