惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

SecWiki News
SecWiki News
Blog — PlanetScale
Blog — PlanetScale
Microsoft Azure Blog
Microsoft Azure Blog
腾讯CDC
Jina AI
Jina AI
Stack Overflow Blog
Stack Overflow Blog
G
Google Developers Blog
MongoDB | Blog
MongoDB | Blog
Microsoft Security Blog
Microsoft Security Blog
CTFtime.org: upcoming CTF events
CTFtime.org: upcoming CTF events
博客园 - 司徒正美
Y
Y Combinator Blog
博客园 - 聂微东
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
T
Troy Hunt's Blog
Forbes - Security
Forbes - Security
L
LINUX DO - 最新话题
AI
AI
S
Secure Thoughts
O
OpenAI News
Google DeepMind News
Google DeepMind News
T
Threat Research - Cisco Blogs
量子位
A
About on SuperTechFans
C
Cybersecurity and Infrastructure Security Agency CISA
The Register - Security
The Register - Security
S
Security Affairs
B
Blog
T
Tenable Blog
Cloudbric
Cloudbric
The Last Watchdog
The Last Watchdog
I
Intezer
L
Lohrmann on Cybersecurity
MyScale Blog
MyScale Blog
H
Hacker News: Front Page
Apple Machine Learning Research
Apple Machine Learning Research
Simon Willison's Weblog
Simon Willison's Weblog
Help Net Security
Help Net Security
N
Netflix TechBlog - Medium
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
WordPress大学
WordPress大学
Schneier on Security
Schneier on Security
H
Heimdal Security Blog
I
InfoQ
Martin Fowler
Martin Fowler
V
V2EX - 技术
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
D
Docker
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
Hacker News: Ask HN
Hacker News: Ask HN

人人都是产品经理

为什么你的产品找不到差异化?90%的失败都卡在第一步上(下) – 人人都是产品经理, 3年从30万到1300万用户、获2200万美元融资,这个AI教育产品用“抽卡”破解了获客难题 – 人人都是产品经理, 园区招商系统怎么做才能真正帮到去化?我加了这一个功能,推广链接转发400次阅读过万 – 人人都是产品经理, AI大事件:OpenAI发完网络安全模型又搞药物研发,小鹏汽车要抓”DeepSeek时刻” – 人人都是产品经理, 电商不是卖货,是一场更残酷的产品经理实战 – 人人都是产品经理, 没想到,活动营销又回来了! – 人人都是产品经理, 为何All-in海外KOC:一场关于AI时代窗口期的豪赌 – 人人都是产品经理, 重新理解企业的内部协作 – 人人都是产品经理, 苹果的 AI 战略到底是什么? – 人人都是产品经理, 医疗智能体·第2讲——合规护城河:等保、PIPL与HIPAA的架构实战 – 人人都是产品经理, 向量知识库五步法:从“答非所问”到“精准回复” – 人人都是产品经理, 鸿蒙PC三方库构建总指挥HPKBUILD(sha)库为例 – 人人都是产品经理, 何时该用LLM?AI产品经理的LLM设计指南 – 人人都是产品经理, 医疗信息领域的需求方、决策方、准入方以及关注点(二) – 人人都是产品经理, 即梦涨价:一场被误读的「傲慢」 – 人人都是产品经理, 面试AI PM必答题:Hermes和OpenClaw的区别,如何讲清楚业务价值 – 人人都是产品经理, AI的下一张船票:世界模型——AI产品经理必须理解的技术拐点 – 人人都是产品经理, 小红书做GEO,怎么让AI信你?记住这 3 个重要信息 – 人人都是产品经理, 5 家印度 AI 初创公司,看看印度 AI 再做什么 – 人人都是产品经理, AI项目跨团队协作:产品技术业务如何不打架 – 人人都是产品经理, Agentic Workflow(智能体工作流):让AI从”答案生成器”变成”数字员工” – 人人都是产品经理, lycium_plusplus 项目全景解读:OpenHarmony 三方库构建的“大管家” – 人人都是产品经理, 从爆单救火到前置履约:两套预采策略,把生鲜大促履约效率拉满 – 人人都是产品经理, 什么时候该补货?我用一轮数据做了一个决定 – 人人都是产品经理, 从“机械兜底”到“动态分流”:AI客服重复进线治理的4大底层逻辑 – 人人都是产品经理, 抖音拼效率,红书拼洞察 – 人人都是产品经理, 全民狂欢与退潮——为什么龙虾这波热潮冷却得如此之快? – 人人都是产品经理, Stripe押注!MPP重塑全球支付 – 人人都是产品经理, 小红书GEO:AI引用你的内容,不是因为你对,而是因为你看起来可信 – 人人都是产品经理, 前百度副总裁押注办公Agent,日韩付费爆发,Manus迎来强劲对手 – 人人都是产品经理, 企事业单位数字化的业务供需本质 – 人人都是产品经理, 医疗智能体·第1讲——医疗信息化重构:从“辅助软件”到“自主智能体”的范式转移 – 人人都是产品经理, 粉丝量就是空气!!! – 人人都是产品经理, 用户说“薯片碎了”,机器回“要买吗?”:意图识别的翻车与破局 – 人人都是产品经理, RAG召回准确率从75到90 我做对了这三件事 – 人人都是产品经理, AI大事件:Anthropic改收费、OpenAI发安全版、手术机器人纳入医保、阿里发布”秒悟” – 人人都是产品经理, Chrome 推出 Skills 新功能,Agent 重塑上网方式 – 人人都是产品经理, GitHub前创始人拿了a16z的1700万美元,做Agent时代的Git – 人人都是产品经理 拷贝或克隆其他 Flutter OH 项目到本地后无法运行 – 人人都是产品经理, 优惠券设计:优惠券创建 – 人人都是产品经理, 不用死磕文档!AI 助手 1 小时搞定飞书 CLI 安装 + 配置 + 知识库 – 人人都是产品经理, 用小龙虾做竞品分析报告:从2天到20分钟,我是怎么做到的 – 人人都是产品经理 用小龙虾做市场分析报告:搞懂这3个公式,市场规模不再靠猜 – 人人都是产品经理, 你早就在做 Harness 工程,只是不知道它叫这个名字 – 人人都是产品经理, Think Long就够?你可能想多了! – 人人都是产品经理, 货代SRM实战:供应商准入怎么做,才能让资源池不是通讯录而是可交付网络? – 人人都是产品经理, 如何做好用户调研?详解基本技巧 – 人人都是产品经理, 木鸟、途家、美团对打,平台春天行动开“卷” – 人人都是产品经理, 入职才发现公司不靠谱?小红书从业者求职避坑指南 – 人人都是产品经理, 美国 AI 三巨头联手封堵,中国 AI 突围之路在何方 – 人人都是产品经理, 小红书,放在需求对面的镜子 – 人人都是产品经理, AI 会带来大规模失业吗? – 人人都是产品经理, 从出单到补货前,我第一次犹豫:该不该放大? – 人人都是产品经理, Flutter 三方库鸿蒙化适配:5 种高效检查方式,快速判断是否需要适配 – 人人都是产品经理, 从做产品进阶拿结果:医美机构产品经理转岗科室运营经理 – 人人都是产品经理, 阿里HappyHorse,一场关于“Token经济”的阳谋 – 人人都是产品经理, To B AI:客户留存落地的观察与思考 – 人人都是产品经理, AI产品的“生命线”——数据采集、标注、清洗的产品化设计 – 人人都是产品经理, 谈谈AI Agent(二):当“孩子”能自己“体验世界”时,你该学什么? – 人人都是产品经理, UI/UX设计师的3层能力进阶,前两层让你活下来,第三层…才是真正的分水岭 – 人人都是产品经理, 2分钟 → 30秒,效率提升75%:B端产品经理如何用「规则枷锁」驯服AI幻觉? – 人人都是产品经理, 还没来得及学OpenClaw,来了个更猛的:Hermes Agent – 人人都是产品经理, AI日报:宇树机器人跑出10m/s刷新世界纪录 – 人人都是产品经理, 一文说透基金互金如何用情绪价值引导用户决策做转化 – 人人都是产品经理, 当浏览器开始替你”看”网页:AI 浏览器正在亲手拆掉它脚下的那张网 – 人人都是产品经理, 0代码,一天时间我Vibe Coding了个网站 – 人人都是产品经理, Hermes 和 OpenClaw 之争,Agent 的能力应该“装上去”还是“长出来”? – 人人都是产品经理 视频生成的“桌子”,字节Seedance 2掀完,阿里快乐马掀 – 人人都是产品经理, 从听不懂到完全信任:我的 Codex 深度产品体验 – 人人都是产品经理, 当虚拟偶像有了北京户口,与真人偶像还有什么区别? – 人人都是产品经理, 会说,远远比会做更重要 —— 对 SBTI 爆火现象的五层观察 – 人人都是产品经理, AI产品经理必看:当“搭环境”比“选模型”更重要,你的认知还在2024年吗? – 人人都是产品经理, 2026年AI产品商业化核心逻辑:从功能demo到规模化营收的3个必破卡点 – 人人都是产品经理, 京东围绕供应链,卷起裤腿下场的那些事儿 – 人人都是产品经理, SBTI一夜刷屏:它赢在了“太会说人话” – 人人都是产品经理, 折扣零售的真相:不是便宜,而是价值感! – 人人都是产品经理, 和甲方吵了一架,最后加钱做了——我学到的ToB产品经理生存法则 – 人人都是产品经理, 和几位小红书操盘手聊了8小时,干货全在这 – 人人都是产品经理, 智谱GLM-5.1登场,开源模型首超Opus4.6!!! – 人人都是产品经理 Anthropic收入凭什么反超OpenAI,终于有人把这事说清楚了 – 人人都是产品经理, 史上最有故事感的技术报告——Claude最强模型Mythos 7个极其精彩的细节 – 人人都是产品经理, 模型不是壁垒,Harness 也不是 – 人人都是产品经理, 抖音本地生活业务思考21 – 人人都是产品经理, Superpowers:145k Star的AI编码框架,到底是什么来头? Superpowers:145k Star的AI编码框架,到底是什么来头? – 人人都是产品经理, OpenAI 的路走错了,Anthropic Harness 解法启示:模型需要实践专科生 – 人人都是产品经理, 画原型图的前一步:设计站点地图 – 人人都是产品经理, 给 DeepSeek 的最后一封催更信 – 人人都是产品经理, 手把手教你用 Claude Code 搭建 AI 营销团队:5 个 Agent、12 项技能,独立完成研究、写作、设计全流程 – 人人都是产品经理, 你以为大模型在学语言?不,它在重新发明语言学 – 人人都是产品经理 所谓Skill,不过是AI时代的工业垃圾 – 人人都是产品经理, 聊一聊内容传播的几个方法 – 人人都是产品经理, 当平台开始吃掉生态:从 OpenClaw 被封杀,读懂 Anthropic 的这盘棋 – 人人都是产品经理, 你装了 10 个 AI 插件,Obsidian 还是一个文件夹 – 人人都是产品经理 关于AI智能体架构演进的系统性思考:从单体试水到多体协同的重构 – 人人都是产品经理, 当“人”变成Skill,我们又该何去何从? – 人人都是产品经理 Mythos 事件:前沿 AI 治理的意外实验 – 人人都是产品经理, 货代CRM:信用与风险管理怎么做,才能把坏账风险拦在放货之前? – 人人都是产品经理, 从HR收集自拍照到员工自助录入——我见证了园区人脸识别从”不可用”到”真好用”的全过程 – 人人都是产品经理 千问闯关AI混沌期:阿里画靶,吴嘉张弓,马云射箭? – 人人都是产品经理,
AI 工程的第四次跃迁:从 Prompt、Context、Harness 到 Loop Engineering – 人人都是产品经理
枝酒 · 2026-06-16 · via 人人都是产品经理

AI编程正经历一场静默革命。从OpenAI到Anthropic,顶尖工程师们正抛弃传统提示词写作,转向更底层的Loop Engineering(循环工程)设计。这场技术范式迁移不仅将开发者生产力提升200%,更揭示了AI时代最稀缺的能力:将模糊需求转化为机器可执行的精准系统指令。本文将深度解析循环工程的四大演进阶段,及其背后暗藏的管理学本质与商业陷阱。

2026 年 6 月 7 日,奥地利程序员 Peter Steinberger 在 X 上发了两句话。大意是:别再一条一条给编码 Agent 写提示词了,去设计一个循环,让循环替你提示它。

没有配图,也没有代码链接。就这两句话,一周内有了五百多万次浏览,AI 编程圈吵成一团。有人骂他装,骂他制造焦虑;也有人承认,他说破了一件大家已经在做、但还没太愿意明说的事。

Peter 是开源项目 OpenClaw 的作者。这个项目三个月冲到十几万 star,他先后拒过一些邀约,最后还是去了 OpenAI。他代码写得很猛。越是这批人,越早开始说:别再把力气都花在手写提示词上了。

这事值得认真看。它不像一个马上会过气的新名词,更像过去四年 AI 工程一路演进后露出来的新台阶。站上去的人,往往也是工资最高、最不该闲着的那群工程师。

先把结论放出来:

过去四年,AI 工程里最值钱的能力一直在往外挪。最早拼的是“怎么跟模型说话”,后来变成“给模型看什么”,再后来变成“给模型搭什么工作环境”。现在轮到一个更外层的问题:怎样让整套系统自己转起来。

这一格有个名字:Loop Engineering,循环工程。

后面稀缺的,不会只是会写提示词的人,而是能把一句含糊的“你帮我把这个搞定”,拆成一组机器能自己判断对错的明确条件的人。

一、表层现象:杠杆换了一个支点

Peter 那条推能吵起来,是因为它戳到了一个正在发生、但很多人还没完全反应过来的变化。

几乎同一时期,Anthropic 负责 Claude Code 的 Boris Cherny 也讲了类似的话。他现在很少直接提示 Claude,而是写循环,让循环去提示 Claude、判断下一步做什么。他的工作变成了“写循环”。两个不同公司的人,几周内指向同一个方向,多半不是偶然。

下面几个数字,都能查证。

Boris 自己从 2025 年 11 月起,代码已经 100% 由 Claude Code 产出,他不再手敲修改,每天提交十到三十个 PR。注意,这是他个人的数据,不是整个公司的平均数。放到 Anthropic 整体,据 Fortune 报道,公司发言人的说法是,70% 到 90% 的代码由 Claude Code 辅助写成,Claude Code 团队内部大约九成。

产出变化也很明显。Anthropic 的内部数据说,今年每位工程师的代码产出涨了 200%,约等于三倍;如果按“每人每天合并的 PR 数”算,增长是 67%。当然,PR 数不是衡量生产力的好尺子,Anthropic 自己也很谨慎。但哪怕打个折,一个人能管的活儿比一年前多出一截,这件事很难忽略。

代码写得太快,瓶颈就跑到了审查上。于是他们又上了 Code Review 功能:每开一个 PR,就派一组 Agent 进去找 bug。连挑错这一步,也开始让机器自动跑。

视野再放大一点。有统计说,公开 GitHub 上大约 4% 的提交已经由 Claude Code 产出;行业里也有人预测,年底可能到五分之一。数字未必精确,方向大概率没错。

把旧工作流和新工作流摆在一起,差别很直观。

旧的:你打开对话框,敲一句需求,AI 回一段。你看一眼,不满意再敲一句。你是这个循环的发动机。循环能转几圈,全看你的手速和耐心。你一离开工位,它就停。

新的:你写一条/loop babysit all my PRs,挂上定时任务,然后去睡觉。后台几个 Agent 自己跑:构建挂了就修,有人留评论就改。你早上醒来,PR 已经提好了。这个例子来自 Boris 官方演示里的命令。/loop最长能无人值守跑三天。

发动机从“你”换成了一段一直在转的程序。

二、这是第四次跃迁,不是第一次

要看懂 Loop 为什么算第四次,得把前三次也放回桌面上。这四步问的是同一个问题,只是每次都往外推了一层。

第一步 · Prompt Engineering(2022 年起):让模型听懂你

ChatGPT 刚火的时候,大家都在琢磨怎么把一句话说得更漂亮。加一句“请一步步思考”,给两个例子,效果马上变好,像变魔术。

它解决的是一个很单纯的问题:怎样在一轮对话里,把一件事说清楚。

它的天花板也明显。再精妙的提示词,一旦被埋进几千字无关聊天记录里,模型照样会视而不见。提示词能管一句话,管不了一整摊信息。

第二步 · Context Engineering(2024—2025):让模型看全局

于是关注点变了。问题不再是“我这句话怎么措辞”,而是“模型此刻到底需要知道哪些东西”。它要看的,是一整个信息环境:记忆、临时检索来的文档、可调用工具的说明、之前的对话历史。

Anthropic 自己写过不少相关内容。一个关键词叫 context rot,直译是“上下文腐烂”。研究发现,喂给模型的内容越长,它的准确率反而越容易下滑,哪怕任务本身并不复杂。Databricks 的研究更具体:准确率大约在 3.2 万个 token 处就开始滑坡,远没到那些号称百万级的上限。

所以这一步的手艺,是狠心做减法。每次让模型干活前,只把最该看的那部分塞进去,其余的压缩、丢弃。提示词工程在这里变成了上下文工程里的一个零件,位置没以前那么中心了。

第三步 · Harness Engineering(2026 年初):给它一套能干活的环境

当 Agent 要连续跑几个小时、做上百个决定时,前两步又不够了。说得清、看得全还不够,它还得守得住规矩。

这一步的源头很清楚。2026 年 2 月,HashiCorp 创始人、Terraform 共同作者 Mitchell Hashimoto 写了篇博客,说他养成了一个习惯:每次 Agent 犯错,他不手动救场,而是在 Agent 的环境里做一个永久修复,让它下次别再犯。他把这件事叫 engineering the harness。harness 是马具,也就是给马上的缰绳。

没过几周,OpenAI 和 Anthropic 相继发文展开,这个词就站住了。

后来大家把它浓缩成一个公式:Agent = Model + Harness。模型负责脑子,Harness 负责规矩、工具、校验和边界。

这件事有多重要?斯坦福和清华有个研究给过一个很吓人的数字:同一个底层模型,只因为外面的 Harness 设计不同,最终表现能差出 6 倍。同样的引擎,有的车几乎开不动,有的车接近老司机水平。LangChain 也拿过实证:一个编码 Agent,模型一个字没换,只改外面的那套东西,在 Terminal Bench 2.0 上从 52.8% 跳到 66.5%。从那以后,Harness 的价值就很难再装作看不见。Martin Fowler 还顺手给这套东西做了词汇表,把控制分成“事前引导”和“事中传感”两类,现在已经成了行业常用说法。

但 Harness 解决的是环境问题。它还没回答另一个问题:谁来一遍遍驱动这台机器转起来?

第四步 · Loop Engineering(2026 年中):让系统自己转

答案就是开头那两句推。

你不再亲手一轮轮戳 Agent,而是设计一个会自动戳 Agent 的系统。它更像一门设计活儿:定目标,让 Agent 自己行动、自己看结果、自己修正,再来一遍,直到达标,或者撞上你设好的停止线。

把四步连起来看,暗线很清楚:

  • Prompt 拼的是语言:你能不能把话说明白;
  • Context 拼的是信息:你能不能把该给的料筛出来、组织好;
  • Harness 拼的是控制:你能不能定好规则和护栏;
  • Loop 拼的是管理:你能不能定一个好目标,再让系统自己去推进。

语言学、信息科学、控制论、管理学,这些老学科被 AI 一步步请了回来。最值钱的支点也一格一格从“裸模型调用”挪到了离模型更远的地方。

三、一个 loop 长什么样:把“loop”拆开看

落到实处,一个能用的循环由几块看得见的零件搭起来。在 Google 做开发者关系的 Addy Osmani 写过一篇长文,把它拆成五块。

第一块,自动触发。循环得有心跳。可以是/loop这样的定时命令,可以是 cron 定时任务,也可以是某个事件自动钩起来,比如有人开了一个 PR。没有心跳,它就转不起来。

第二块,工作树隔离(worktree)。让每个 Agent 在各自独立的分支上干活,互不踩脚。这里有个反常识点:真正卡住并行能力的,往往是审查带宽。你能开几个 Agent 不稀奇,你能审几个,才决定上限。

第三块,项目的“随身知识”。把项目规矩、踩过的坑、目录结构,写进 Skills、CLAUDE.md、记忆文件或文档里。这里的原则就一句:写一次,每次都读。Agent 每开一轮就会失忆,你不写下来,它每次都从零开始猜。

第四块,连接器(MCP)。把 Agent 接到你真实使用的工具上:GitHub、Linear、Slack、Sentry。这样它能跑通一条完整链路:发现报错,改掉它,开 PR,关联工单,再到群里通知一声。这里每一步都是真动作,不是演示。

第五块,分工的子 Agent。让干活的和检查的分开:一个负责写,一个专门挑刺。工程上常叫评估者—优化者模式。好处很朴素:检查的那个不会替干活的那个打掩护。

零件齐了,也别急着一步到位。最小可用的循环只需要四样:一个触发、一个写好的指令、一个状态文件、一道验证门。顺序也别反:手动把这件事完整跑通一遍,整理成可复用的指令,包进循环,最后再配定时。

这套东西里,最容易被忽略、也最像脊梁的,是那个状态文件,常见名字是 STATE.md。道理朴素到有点好笑:AI 每跑一轮都会忘,状态文件不会忘。它记着现在干到哪了、上次为什么失败、下一步该试什么。一个循环能不能熬过几十轮不跑偏,很大程度上就看这张纸写得怎么样。

四、拼到最后,拼的不是工程,是管理

会写脚本、会配 hook,不是这件事里最稀缺的能力。最重要的是把目标定清楚。

举个最直观的对比。你对 Agent 说“把这个应用优化一下”,和你对它说“让所有测试和登录流程全部通过、TypeScript 编译零报错、代码检查零违规”,这两句话喂进同一个循环,跑出来会是两个世界。

前一句里,“优化”可以有一万种解释。Agent 会拿着其中一种理解自由发挥。后一句给了它一把尺子,它知道什么叫做完。

这不是新东西。管理学早就讲过。彼得·德鲁克的目标管理,安迪·格鲁夫在英特尔推的 OKR,内核都是同一件事:把一个人脑子里的模糊意图,翻译成别人能衡量、能验证的明确目标。

带过团队的人都懂,好的管理无非三件事:目标清楚、资源管够、反馈及时。回头看一个好循环,也一样需要这三件事:明确的完成标准,足够的工具和 token,一道能立刻告诉它对错的验证门。

区别在于,管 Agent 比管人更极端。人卡住时,可能会回来问你:“老板,这个我没太懂。”Agent 通常不会。它会带着对你那句模糊指令的某种理解,一头扎进去,跑出一堆你根本没想要的东西,而且跑得很快。你在目标里漏掉的每个边界,它都会忠实地、加速地暴露出来。

所以那些曾经被嘲笑“没用”的文科能力,比如把话说精确、把意图拆清楚、判断什么重要什么不重要,在这个阶段反而更值钱了。

五、越好用的循环,越要小心:陷阱和边界

动手之前,先泼几盆冷水。

第一个坑,古德哈特定律。这条定律说:当一个指标变成目标,它就不再是个好指标。放到这里就是,你给 Agent 设了“所有测试必须通过”,它可能不会老老实实修代码,而是发现把失败的测试删掉也能让指标变绿。它优化的是那把尺子,不一定是你想要的结果。

破解办法,还是要把 Harness 拉回来。目标里不能只有“要达到什么”,还要写清楚“不许怎么做”。护栏在循环里的位置,就在这里。

第二件事,先问自己配不配上车。一个循环要真的省钱,得同时满足四个条件。缺一个,成本就很容易大过收益:

  1. 这件事每周至少重复一次。循环的搭建成本,要靠反复运行摊平;
  2. 结果能自动验证。有测试、有编译、有明确的对错判断。否则你还是要人工一遍遍看,并没有省下多少;
  3. 你的 token 预算扛得住浪费。循环一定会有空转和无效尝试;
  4. Agent 手上有高级工程师级别的工具。它要能跑测试、查日志、开 PR。

照这四条看,有几类人现在不适合急着上:用消费版工具的独立开发者;项目本身无法自动验证对错的人;瓶颈卡在审查而不是产出的团队。产出再快,审不过来,循环只会把堵点堆得更高。

第三,几种典型翻车姿势,名字可以先记一下:

  • Ralph Wiggum 循环:循环看着在转,其实原地打转,悄悄烧钱,半天没有真进展;
  • 理解债务:代码是 Agent 写的,能跑,但全队没人真懂它怎么实现。出事那天,没人能救;
  • 认知放弃:你太信任循环,慢慢不再看它到底干了什么,判断力一点点退化;
  • 安全税:自动化跑得越久,权限和密钥的风险敞口越大。最好养成固定审权限的习惯,比如每 30 天重新看一遍。

烧钱也不是吓唬人。计量收费成了主流之后,受冲击最大的,恰好是最早拥抱 Agent 工作流的那批开发者。厂商鼓励你两年“让 Agent 放开跑”,账单也跟着放开跑。有据可查的案例里,一段三小时的 Claude Opus 高强度会话,花掉过 151 美元。一个没设预算上限、又在空转的循环,能烧多快,不难想。

结尾:你现在该怎么办

这四次跃迁,讲的是同一个故事:

人一直在练一件事:把“我想要什么”说得越来越精确。一开始是说给一个模型听,现在是说给一整套能自动运转的系统听。对象升级了,这件本事的内核没变,而且会越来越值钱。

“AI 来了,文科就没用了”这句话,方向说反了。当机器能自己执行时,把意图说清楚、把目标定明白、把边界划干净,这些来自管理学、心理学和表达力的活儿,反而成了你和机器之间最后一道硬门槛。

只讲道理不够,给一套能上手的路径。不需要你是工程师,产品、运营、做内容的人,也可以用它重新看自己的工作。

第一步,找任务,别找循环。别一上来就想搭系统。先在日常工作里找一件事,它同时满足两个条件:重复做过三次以上,而且结果能客观判断对错。找不到这样的事,就还没到上循环的时候。

第二步,自己先把它跑通一遍。用手从头到尾做一次,把每一步、每个判断都记下来。你自己都说不清的流程,别指望机器替你想清楚。

第三步,把“做完了”写成一把尺子。这是最难、也最值钱的一步。把“做得好”这种模糊话,改成机器能逐条检查的条件。写不出可验证标准,通常说明你自己还没想清楚。

第四步,把指令整理成能复用的一块。别每次重新打一长串话。把它写成固定指令、Skill 或文档。写一次,以后每次都调用。

第五步,给它配一道会说“不”的关。一个测试、一次检查、一道人工审核门都行。没有任何东西能反驳它的循环,等于让 Agent 自己给自己打分,迟早出事。

第六步,最后才挂定时,小预算试跑。一开始给小额度,盯紧两个数:烧了多少 token,错误率多高。确认它真在干正事,再慢慢放权。

没有哪一级天然高人一等。但记住一条:

一件事你重复做了三次,就该停下来想想,它能不能自动化。

本文由 @枝酒 原创发布于人人都是产品经理。未经作者许可,禁止转载

题图来自 Unsplash,基于CC0协议