





















在AI产品领域,模型调优已不再是核心竞争力——Loop Engineering(循环工程)正在成为真正拉开差距的关键。从验证循环到数据飞轮,这套方法论不仅决定了产品体验的可靠性,更是AI时代难以复制的护城河。本文将深入拆解循环工程的四大层级,揭示AI产品经理如何在模型之外构建持续进化的竞争壁垒。

先说个可能让你不舒服的判断:在 AI 这行,模型是最不值钱的东西。
谁都能调最强的 API、谁都能下最新的开源权重——你引以为傲的“模型选型”,对手一个下午就追平。真正能拉开差距、还越拉越大的,是另一件最近才有名字的事——Loop Engineering(循环工程)。
这个词的来历挺清楚:先是 Peter Steinberger、Boris(Claude Code 负责人)这些一线的人放话——“我现在已经不亲手写提示词了,我写一堆‘循环’在后台跑,是它们在驱动 agent 决定该干什么”;接着 Google Chrome 团队的 Addy Osmani 把这波讨论收拢成一篇文章,正式叫它 《Loop Engineering》;LangChain、Swyx 又从框架角度接着展开。眼下真正算主流共识的,其实是它的近亲 Context Engineering——但我赌 Loop Engineering 早晚会火,因为它点破了一件做 AI 产品的人天天在干、却一直说不清的事。
而我要说一句更得罪人的话:对 AI 产品经理来说,Loop Engineering 根本不是个“可选的新技能”,它是 AI 时代的看家本领。 会调模型的人遍地都是——那是这行最不稀缺的能力;真正能把产品做出来、做到别人追不上的,是会设计“循环”的人。
这篇就从一个 AI 产品经理的视角,把这件事讲透。
它的内核特别朴素,用“开环 / 闭环”一说就明白。
开环,是发出指令就不管了——老式洗衣机定时 30 分钟,到点就停,不管衣服洗没洗干净。闭环,是带反馈的——空调实时测温度,没到设定值就接着调。
传统软件可以开环,因为它的逻辑是确定的,1+1 永远等于 2,写对一次就永远对。但大模型是概率性的:同一句话,今天这么答、明天那么答,会一本正经地编、会错、会随数据慢慢漂。你没法假设它“一次就对”。
所以做 AI 产品,你得在每个可能出错的地方,装一个“回头看一眼、不对就修”的循环。把这些循环设计好、组织好,就是 Loop Engineering。
它和“提示词工程”最大的区别在于管的范围:提示词工程,你只控制了“模型决定下一步”那一个动作;而循环工程,管的是“看状态 → 做决定 → 执行 → 收反馈 → 判断完没完”这一整圈。
LangChain 那篇 《The Art of Loop Engineering》 把这一整圈又拆成了四层、一层套一层:
这套拆法很专业,但它是工程师的视角——讲的是用什么组件、怎么把每一层搭出来。而我想说的是:AI 产品经理看这四层,重点根本不该落在“怎么搭”上,而该落在“在哪埋、为什么埋”。 下面这一节就讲这个。
举个 LangChain 自己提到的细节:他们说,加上验证循环会增加每次运行的延迟和成本,但“当质量比速度更重要时就值得——而这是大多数生产场景”。
你看,这句话里藏着的,根本不是技术问题,是产品判断:这个功能,质量重要还是速度重要?为了多一分可信,值不值得让用户多等两秒、让公司多烧一倍算力?
这就是 AI 产品经理在 Loop Engineering 里的位置。 工程师负责把循环“实现”出来;而决定在哪埋循环、埋多深、谁来兜底、怎么算这笔成本账的,是 AI 产品经理。同一套循环,技术能搭出一百种,但只有产品的人知道:这个场景的红线在哪、用户能忍受多长的等待、错了之后体验该怎么收场。
说得再直白点:会调模型,是 AI 产品经理最不稀缺的能力——模型是买来的、人人能调。而会设计循环、会判断“哪里该回头看一眼”,才是真正的看家本领。
把“循环”提到核心能力,不只是因为它影响体验。更狠的一层是:Loop Engineering 是 AI 产品里,少数几个真正算护城河的东西。而你们还在抢的模型,根本不是。
这话听着狂,但连 Google 自己都这么说。2023 年有一份泄露的 Google 内部备忘录,标题直接叫 《We Have No Moat, And Neither Does OpenAI》(我们没有护城河,OpenAI 也没有)。写它的 Google 研究员直言:开源在以吓人的速度逼近,大厂那点模型领先,撑不成护城河。
我们拿“护城河”该有的标准量一量就清楚了。一个东西算不算护城河(巴菲特管它叫 economic moat),看三条:难不难复制、有没有复利、是不是越拖越深。
先量模型:开源几个月迭代一代、闭源 API 谁都能调,难复制?不难。模型会因为你用就变强吗?不会,没复利。退一步,就算抢到最强的模型够吗?看组公开数据:NL2SQL 这行最权威的评测榜 BIRD,人类水平 92.96%,顶尖模型在标准榜已飙到 90% 以上。听着很神?可同一个 BIRD,官方说只要把条件换成更贴近真实业务的严苛设定,最强模型之一 o3-mini 也只剩 44.81%。考场 90 分、现场 45 分——模型是入场券,不是你赢的原因。
再量 Loop Engineering:几路校验怎么配才独立、转人工的线划在哪、那个爬坡循环怎么转才不会越转越歪,全是踩坑攒的 know-how,难复制;而它的第四层——爬坡 / 数据飞轮——用得越多、数据越多、产品越准、越多人用,是台复利机器;飞轮转得越久,别人越追不上,越拖越深。三条全中。
模型一条不沾,循环三条全中。所以标题那句话不是我喊的,是量出来的:模型不是护城河,Loop Engineering 才是。
LangChain 按“技术层”分四层;我换成 AI 产品经理天天要做的四个决策来分。你会发现,每一个循环,本质都是一道产品判断题。
循环一 · 要不要校验? 单次输出不能全信,让模型用不同策略多做几遍、结果一致才采纳,这叫 self-consistency;更狠一点,可以让写答案的模型和审答案的模型不是同一个(业内叫对抗式验证,写的容易对自己的活手软)。但AI 产品经理要判断的是:这个场景值不值得为可信多花一倍算力?哪条是“宁可慢也不能错”的红线?
循环二 · 出错了怎么收场? 报错别原样甩给用户,喂回给模型让它自己改了重试,这就是 ReAct。AI 产品经理要设计的是:自纠几次还不行就降级到什么程度?给用户看到的是一句人话兜底,还是一串红色报错?这是体验,不是技术。
循环三 · 人放在哪? 搞不定的转人工。但转人工不是认怂,是在喂饭——每次人工纠对,都产出一条“问题+错答案+对答案+错因”的高质量数据。AI 产品经理要设计的是:把人放在模型最没把握的那个位置,并且让他每一次纠正,都顺手变成喂给系统的数据。
循环四 · 怎么让它越用越好? 把转人工攒的纠错记录,归因、改提示词、补示例、再回归一遍,下次不再犯。这就是数据飞轮。这是四个里最值钱的一个,而且它纯粹是产品设计——飞轮不会自己转,是你在交互里埋好了“用户的每一次修改都被回收”,它才转得起来。
工程师给你四层可以调用的能力;AI 产品经理的活,是在这四层上做四个判断——红线、体验、人机分工、数据闭环。
讲到这你可能热血上头,想给所有功能都套个循环。打住——会判断“什么时候别上循环”,恰恰是 AI 产品经理比工程师更该有的清醒。
Addy Osmani 在 原文 里给了四条很实在的标准,全中才值得搭一个循环:① 这事每周以上重复(一次性的活,搭循环的成本都赚不回来);② 验证能自动化(有测试、有检查,能自己把坏结果挡掉,不靠你肉眼盯);③ token 预算扛得住(循环会反复试探、来回烧 token);④ agent 有能自查的环境(有日志、能复现问题、能把自己产出的东西跑起来看)。
业内也有泼冷水的声音,很值得听。YouTuber Ross Mike 几乎逐条反驳了“无脑上循环”:循环很烧钱(他说重度玩家一个月的 token 开销能到百万美元量级——这个具体数字是他的说法、未必精确,但方向是对的:全自动循环很贵);更要命的是“你以为你的需求文档写全了,但人根本不可能在一个文档里穷尽产品的所有细节”——于是循环会带着一堆错误假设一路狂奔,最后产出一个“能跑但不是你要的”东西,他形容这像一台老虎机。他的结论很犀利:循环只在“流程封闭、反馈固定、对错分明”的场景才靠谱——比如代码审查、批量生成同质的 SEO 页面;而需要创意判断、需要中途拿用户反馈的(比如从头做一个 App),全自动循环就是灾难。他有句话我很认同:“AI 能复制酱料,但造不出酱料。”
翻译成 AI 产品经理的语言,就一句话:别一上来就追求“全自动”。先挑一件“高频重复 + 能自动验证 + 风险可控”的小事,把它做成循环;那些需要创意、需要人拍板的环节,老老实实把人留在回路里。 什么该交给循环、什么必须人来兜,这个边界判断,才是你的价值。
下次你设计任何一个 AI 功能,先别急着挑模型,拿这四个问题过一遍——这其实就是在给你的护城河探坑:
这四问,但凡一个答案是“没有、开环、不管”,那就是你产品里一个开环的口子——AI 产品的事故和平庸,基本都从这种口子漏出来。
把功夫从“调模型”转到“设计循环”,是我认为 AI 产品经理在这一波最该完成的认知升级。但 Addy Osmani 在原文末尾的提醒,每个做 AI 产品的人都该记住——循环用爽了,有三个代价会悄悄找上门:
Addy Osmani 给了一句特别精炼的话:设计循环,带着判断力去做是解药,为了逃避思考去做是毒药——同一个动作,相反的结果。他的原话是:“Build the loop. Stay the engineer.”(搭好你的循环,但别丢掉你的判断。)
对 AI 产品经理来说,这句话还要再加半句:搭好你的循环,但始终当那个做判断的人——而不是那个只会按下“启动”键、然后把一切交给机器的人。
AI 产品的上半场,大家比谁会调模型、谁的提示词更灵;可这些都在被飞快地商品化,迟早变成谁都用得起的水和电。下半场比的,是谁能在模型外面,一层层把循环搭对,又始终守住那个“什么该自动、什么该自己拍板”的判断。
模型是借来的,会被拉平的;循环是你自己搭的,越搭越深的。
所以下次做 AI 产品,别只盯着“用哪个模型”了。多问自己一句—— 我,到底给我的产品,设计了几个循环;又有哪几个判断,我没敢交出去?
参考资料:
本文由 @Rowan 原创发布于人人都是产品经理。未经作者许可,禁止转载
题图来自Unsplash,基于CC0协议
此内容由惯性聚合(RSS阅读器)自动聚合整理,仅供阅读参考。 原文来自 — 版权归原作者所有。