惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

N
Netflix TechBlog - Medium
cs.AI updates on arXiv.org
cs.AI updates on arXiv.org
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
GbyAI
GbyAI
B
Blog RSS Feed
爱范儿
爱范儿
云风的 BLOG
云风的 BLOG
腾讯CDC
Know Your Adversary
Know Your Adversary
H
Help Net Security
Scott Helme
Scott Helme
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
Exploit-DB.com RSS Feed
Exploit-DB.com RSS Feed
WordPress大学
WordPress大学
S
Schneier on Security
L
Lohrmann on Cybersecurity
博客园 - 【当耐特】
宝玉的分享
宝玉的分享
T
Troy Hunt's Blog
C
CERT Recently Published Vulnerability Notes
B
Blog
Google DeepMind News
Google DeepMind News
Security Latest
Security Latest
PCI Perspectives
PCI Perspectives
博客园 - 司徒正美
罗磊的独立博客
F
Fortinet All Blogs
月光博客
月光博客
H
Heimdal Security Blog
U
Unit 42
N
News and Events Feed by Topic
C
Cyber Attacks, Cyber Crime and Cyber Security
小众软件
小众软件
T
Tenable Blog
Microsoft Azure Blog
Microsoft Azure Blog
Simon Willison's Weblog
Simon Willison's Weblog
AWS News Blog
AWS News Blog
Microsoft Security Blog
Microsoft Security Blog
T
Threatpost
博客园 - 三生石上(FineUI控件)
P
Palo Alto Networks Blog
V
Visual Studio Blog
L
LINUX DO - 热门话题
Google Online Security Blog
Google Online Security Blog
I
InfoQ
阮一峰的网络日志
阮一峰的网络日志
Project Zero
Project Zero
T
Tor Project blog
AI
AI
S
Security @ Cisco Blogs

人人都是产品经理

为什么你的产品找不到差异化?90%的失败都卡在第一步上(下) – 人人都是产品经理, 3年从30万到1300万用户、获2200万美元融资,这个AI教育产品用“抽卡”破解了获客难题 – 人人都是产品经理, 园区招商系统怎么做才能真正帮到去化?我加了这一个功能,推广链接转发400次阅读过万 – 人人都是产品经理, AI大事件:OpenAI发完网络安全模型又搞药物研发,小鹏汽车要抓”DeepSeek时刻” – 人人都是产品经理, 电商不是卖货,是一场更残酷的产品经理实战 – 人人都是产品经理, 没想到,活动营销又回来了! – 人人都是产品经理, 为何All-in海外KOC:一场关于AI时代窗口期的豪赌 – 人人都是产品经理, 重新理解企业的内部协作 – 人人都是产品经理, 苹果的 AI 战略到底是什么? – 人人都是产品经理, 医疗智能体·第2讲——合规护城河:等保、PIPL与HIPAA的架构实战 – 人人都是产品经理, 向量知识库五步法:从“答非所问”到“精准回复” – 人人都是产品经理, 鸿蒙PC三方库构建总指挥HPKBUILD(sha)库为例 – 人人都是产品经理, 何时该用LLM?AI产品经理的LLM设计指南 – 人人都是产品经理, 医疗信息领域的需求方、决策方、准入方以及关注点(二) – 人人都是产品经理, 即梦涨价:一场被误读的「傲慢」 – 人人都是产品经理, 面试AI PM必答题:Hermes和OpenClaw的区别,如何讲清楚业务价值 – 人人都是产品经理, AI的下一张船票:世界模型——AI产品经理必须理解的技术拐点 – 人人都是产品经理, 小红书做GEO,怎么让AI信你?记住这 3 个重要信息 – 人人都是产品经理, 5 家印度 AI 初创公司,看看印度 AI 再做什么 – 人人都是产品经理, AI项目跨团队协作:产品技术业务如何不打架 – 人人都是产品经理, Agentic Workflow(智能体工作流):让AI从”答案生成器”变成”数字员工” – 人人都是产品经理, lycium_plusplus 项目全景解读:OpenHarmony 三方库构建的“大管家” – 人人都是产品经理, 从爆单救火到前置履约:两套预采策略,把生鲜大促履约效率拉满 – 人人都是产品经理, 什么时候该补货?我用一轮数据做了一个决定 – 人人都是产品经理, 从“机械兜底”到“动态分流”:AI客服重复进线治理的4大底层逻辑 – 人人都是产品经理, 抖音拼效率,红书拼洞察 – 人人都是产品经理, 全民狂欢与退潮——为什么龙虾这波热潮冷却得如此之快? – 人人都是产品经理, Stripe押注!MPP重塑全球支付 – 人人都是产品经理, 小红书GEO:AI引用你的内容,不是因为你对,而是因为你看起来可信 – 人人都是产品经理, 前百度副总裁押注办公Agent,日韩付费爆发,Manus迎来强劲对手 – 人人都是产品经理, 企事业单位数字化的业务供需本质 – 人人都是产品经理, 医疗智能体·第1讲——医疗信息化重构:从“辅助软件”到“自主智能体”的范式转移 – 人人都是产品经理, 粉丝量就是空气!!! – 人人都是产品经理, 用户说“薯片碎了”,机器回“要买吗?”:意图识别的翻车与破局 – 人人都是产品经理, RAG召回准确率从75到90 我做对了这三件事 – 人人都是产品经理, AI大事件:Anthropic改收费、OpenAI发安全版、手术机器人纳入医保、阿里发布”秒悟” – 人人都是产品经理, Chrome 推出 Skills 新功能,Agent 重塑上网方式 – 人人都是产品经理, GitHub前创始人拿了a16z的1700万美元,做Agent时代的Git – 人人都是产品经理 拷贝或克隆其他 Flutter OH 项目到本地后无法运行 – 人人都是产品经理, 优惠券设计:优惠券创建 – 人人都是产品经理, 不用死磕文档!AI 助手 1 小时搞定飞书 CLI 安装 + 配置 + 知识库 – 人人都是产品经理, 用小龙虾做竞品分析报告:从2天到20分钟,我是怎么做到的 – 人人都是产品经理 用小龙虾做市场分析报告:搞懂这3个公式,市场规模不再靠猜 – 人人都是产品经理, 你早就在做 Harness 工程,只是不知道它叫这个名字 – 人人都是产品经理, Think Long就够?你可能想多了! – 人人都是产品经理, 货代SRM实战:供应商准入怎么做,才能让资源池不是通讯录而是可交付网络? – 人人都是产品经理, 如何做好用户调研?详解基本技巧 – 人人都是产品经理, 木鸟、途家、美团对打,平台春天行动开“卷” – 人人都是产品经理, 入职才发现公司不靠谱?小红书从业者求职避坑指南 – 人人都是产品经理, 美国 AI 三巨头联手封堵,中国 AI 突围之路在何方 – 人人都是产品经理, 小红书,放在需求对面的镜子 – 人人都是产品经理, AI 会带来大规模失业吗? – 人人都是产品经理, 从出单到补货前,我第一次犹豫:该不该放大? – 人人都是产品经理, Flutter 三方库鸿蒙化适配:5 种高效检查方式,快速判断是否需要适配 – 人人都是产品经理, 从做产品进阶拿结果:医美机构产品经理转岗科室运营经理 – 人人都是产品经理, 阿里HappyHorse,一场关于“Token经济”的阳谋 – 人人都是产品经理, To B AI:客户留存落地的观察与思考 – 人人都是产品经理, AI产品的“生命线”——数据采集、标注、清洗的产品化设计 – 人人都是产品经理, 谈谈AI Agent(二):当“孩子”能自己“体验世界”时,你该学什么? – 人人都是产品经理, UI/UX设计师的3层能力进阶,前两层让你活下来,第三层…才是真正的分水岭 – 人人都是产品经理, 2分钟 → 30秒,效率提升75%:B端产品经理如何用「规则枷锁」驯服AI幻觉? – 人人都是产品经理, 还没来得及学OpenClaw,来了个更猛的:Hermes Agent – 人人都是产品经理, AI日报:宇树机器人跑出10m/s刷新世界纪录 – 人人都是产品经理, 一文说透基金互金如何用情绪价值引导用户决策做转化 – 人人都是产品经理, 当浏览器开始替你”看”网页:AI 浏览器正在亲手拆掉它脚下的那张网 – 人人都是产品经理, 0代码,一天时间我Vibe Coding了个网站 – 人人都是产品经理, Hermes 和 OpenClaw 之争,Agent 的能力应该“装上去”还是“长出来”? – 人人都是产品经理 视频生成的“桌子”,字节Seedance 2掀完,阿里快乐马掀 – 人人都是产品经理, 从听不懂到完全信任:我的 Codex 深度产品体验 – 人人都是产品经理, 当虚拟偶像有了北京户口,与真人偶像还有什么区别? – 人人都是产品经理, 会说,远远比会做更重要 —— 对 SBTI 爆火现象的五层观察 – 人人都是产品经理, AI产品经理必看:当“搭环境”比“选模型”更重要,你的认知还在2024年吗? – 人人都是产品经理, 2026年AI产品商业化核心逻辑:从功能demo到规模化营收的3个必破卡点 – 人人都是产品经理, 京东围绕供应链,卷起裤腿下场的那些事儿 – 人人都是产品经理, SBTI一夜刷屏:它赢在了“太会说人话” – 人人都是产品经理, 折扣零售的真相:不是便宜,而是价值感! – 人人都是产品经理, 和甲方吵了一架,最后加钱做了——我学到的ToB产品经理生存法则 – 人人都是产品经理, 和几位小红书操盘手聊了8小时,干货全在这 – 人人都是产品经理, 智谱GLM-5.1登场,开源模型首超Opus4.6!!! – 人人都是产品经理 Anthropic收入凭什么反超OpenAI,终于有人把这事说清楚了 – 人人都是产品经理, 史上最有故事感的技术报告——Claude最强模型Mythos 7个极其精彩的细节 – 人人都是产品经理, 模型不是壁垒,Harness 也不是 – 人人都是产品经理, 抖音本地生活业务思考21 – 人人都是产品经理, Superpowers:145k Star的AI编码框架,到底是什么来头? Superpowers:145k Star的AI编码框架,到底是什么来头? – 人人都是产品经理, OpenAI 的路走错了,Anthropic Harness 解法启示:模型需要实践专科生 – 人人都是产品经理, 画原型图的前一步:设计站点地图 – 人人都是产品经理, 给 DeepSeek 的最后一封催更信 – 人人都是产品经理, 手把手教你用 Claude Code 搭建 AI 营销团队:5 个 Agent、12 项技能,独立完成研究、写作、设计全流程 – 人人都是产品经理, 你以为大模型在学语言?不,它在重新发明语言学 – 人人都是产品经理 所谓Skill,不过是AI时代的工业垃圾 – 人人都是产品经理, 聊一聊内容传播的几个方法 – 人人都是产品经理, 当平台开始吃掉生态:从 OpenClaw 被封杀,读懂 Anthropic 的这盘棋 – 人人都是产品经理, 你装了 10 个 AI 插件,Obsidian 还是一个文件夹 – 人人都是产品经理 关于AI智能体架构演进的系统性思考:从单体试水到多体协同的重构 – 人人都是产品经理, 当“人”变成Skill,我们又该何去何从? – 人人都是产品经理 Mythos 事件:前沿 AI 治理的意外实验 – 人人都是产品经理, 货代CRM:信用与风险管理怎么做,才能把坏账风险拦在放货之前? – 人人都是产品经理, 从HR收集自拍照到员工自助录入——我见证了园区人脸识别从”不可用”到”真好用”的全过程 – 人人都是产品经理 千问闯关AI混沌期:阿里画靶,吴嘉张弓,马云射箭? – 人人都是产品经理,
模型不是护城河,Loop Engineering 才是 – 人人都是产品经理
Rowan · 2026-06-18 · via 人人都是产品经理

在AI产品领域,模型调优已不再是核心竞争力——Loop Engineering(循环工程)正在成为真正拉开差距的关键。从验证循环到数据飞轮,这套方法论不仅决定了产品体验的可靠性,更是AI时代难以复制的护城河。本文将深入拆解循环工程的四大层级,揭示AI产品经理如何在模型之外构建持续进化的竞争壁垒。

先说个可能让你不舒服的判断:在 AI 这行,模型是最不值钱的东西。

谁都能调最强的 API、谁都能下最新的开源权重——你引以为傲的“模型选型”,对手一个下午就追平。真正能拉开差距、还越拉越大的,是另一件最近才有名字的事——Loop Engineering(循环工程)

这个词的来历挺清楚:先是 Peter Steinberger、Boris(Claude Code 负责人)这些一线的人放话——“我现在已经不亲手写提示词了,我写一堆‘循环’在后台跑,是它们在驱动 agent 决定该干什么”;接着 Google Chrome 团队的 Addy Osmani 把这波讨论收拢成一篇文章,正式叫它 《Loop Engineering》;LangChain、Swyx 又从框架角度接着展开。眼下真正算主流共识的,其实是它的近亲 Context Engineering——但我赌 Loop Engineering 早晚会火,因为它点破了一件做 AI 产品的人天天在干、却一直说不清的事。

而我要说一句更得罪人的话:对 AI 产品经理来说,Loop Engineering 根本不是个“可选的新技能”,它是 AI 时代的看家本领。 会调模型的人遍地都是——那是这行最不稀缺的能力;真正能把产品做出来、做到别人追不上的,是会设计“循环”的人。

这篇就从一个 AI 产品经理的视角,把这件事讲透。

先搞懂:Loop Engineering 到底是什么

它的内核特别朴素,用“开环 / 闭环”一说就明白。

开环,是发出指令就不管了——老式洗衣机定时 30 分钟,到点就停,不管衣服洗没洗干净。闭环,是带反馈的——空调实时测温度,没到设定值就接着调。

传统软件可以开环,因为它的逻辑是确定的,1+1 永远等于 2,写对一次就永远对。但大模型是概率性的:同一句话,今天这么答、明天那么答,会一本正经地编、会错、会随数据慢慢漂。你没法假设它“一次就对”。

所以做 AI 产品,你得在每个可能出错的地方,装一个“回头看一眼、不对就修”的循环。把这些循环设计好、组织好,就是 Loop Engineering。

它和“提示词工程”最大的区别在于管的范围:提示词工程,你只控制了“模型决定下一步”那一个动作;而循环工程,管的是“看状态 → 做决定 → 执行 → 收反馈 → 判断完没完”这一整圈。

LangChain 那篇 《The Art of Loop Engineering》 把这一整圈又拆成了四层、一层套一层

  1. Agent 循环(Agent loop)——模型在循环里调用工具,直到任务完成。最底层、最基础的循环。
  2. 验证循环(Verification loop)——给输出加一个“判分器”(可以是规则,也可以是另一个模型当裁判),不达标就带反馈打回重做。
  3. 事件驱动循环(Event-driven loop)——把 agent 接到真实环境里,由事件触发(来了条消息、到了点、收到个 webhook 就自动跑),从“你点一下它动一下”变成“后台一直在转”。
  4. 爬坡循环(Hill climbing loop)——每次运行都留下记录(trace),让一个分析程序去看这些记录、找出问题,反过来修改 agent 自己的配置。LangChain 说这层“最重要”——因为前三层是自动化“干活”,第四层是自动化“变好”。

    这套拆法很专业,但它是工程师的视角——讲的是用什么组件、怎么把每一层搭出来。而我想说的是:AI 产品经理看这四层,重点根本不该落在“怎么搭”上,而该落在“在哪埋、为什么埋”。 下面这一节就讲这个。

工程师管“怎么搭”,AI 产品经理管“在哪埋”

举个 LangChain 自己提到的细节:他们说,加上验证循环会增加每次运行的延迟和成本,但“当质量比速度更重要时就值得——而这是大多数生产场景”。

你看,这句话里藏着的,根本不是技术问题,是产品判断:这个功能,质量重要还是速度重要?为了多一分可信,值不值得让用户多等两秒、让公司多烧一倍算力?

这就是 AI 产品经理在 Loop Engineering 里的位置。 工程师负责把循环“实现”出来;而决定在哪埋循环、埋多深、谁来兜底、怎么算这笔成本账的,是 AI 产品经理。同一套循环,技术能搭出一百种,但只有产品的人知道:这个场景的红线在哪、用户能忍受多长的等待、错了之后体验该怎么收场。

说得再直白点:会调模型,是 AI 产品经理最不稀缺的能力——模型是买来的、人人能调。而会设计循环、会判断“哪里该回头看一眼”,才是真正的看家本领。

Loop Engineering:模型给不了的护城河

把“循环”提到核心能力,不只是因为它影响体验。更狠的一层是:Loop Engineering 是 AI 产品里,少数几个真正算护城河的东西。而你们还在抢的模型,根本不是。

这话听着狂,但连 Google 自己都这么说。2023 年有一份泄露的 Google 内部备忘录,标题直接叫 《We Have No Moat, And Neither Does OpenAI》(我们没有护城河,OpenAI 也没有)。写它的 Google 研究员直言:开源在以吓人的速度逼近,大厂那点模型领先,撑不成护城河。

我们拿“护城河”该有的标准量一量就清楚了。一个东西算不算护城河(巴菲特管它叫 economic moat),看三条:难不难复制、有没有复利、是不是越拖越深。

先量模型:开源几个月迭代一代、闭源 API 谁都能调,难复制?不难。模型会因为你用就变强吗?不会,没复利。退一步,就算抢到最强的模型够吗?看组公开数据:NL2SQL 这行最权威的评测榜 BIRD,人类水平 92.96%,顶尖模型在标准榜已飙到 90% 以上。听着很神?可同一个 BIRD,官方说只要把条件换成更贴近真实业务的严苛设定,最强模型之一 o3-mini 也只剩 44.81%。考场 90 分、现场 45 分——模型是入场券,不是你赢的原因。

再量 Loop Engineering:几路校验怎么配才独立、转人工的线划在哪、那个爬坡循环怎么转才不会越转越歪,全是踩坑攒的 know-how,难复制;而它的第四层——爬坡 / 数据飞轮——用得越多、数据越多、产品越准、越多人用,是台复利机器;飞轮转得越久,别人越追不上,越拖越深。三条全中。

模型一条不沾,循环三条全中。所以标题那句话不是我喊的,是量出来的:模型不是护城河,Loop Engineering 才是。

AI 产品经理的四个循环:每一个都是一道决策

LangChain 按“技术层”分四层;我换成 AI 产品经理天天要做的四个决策来分。你会发现,每一个循环,本质都是一道产品判断题。

循环一 · 要不要校验? 单次输出不能全信,让模型用不同策略多做几遍、结果一致才采纳,这叫 self-consistency;更狠一点,可以让写答案的模型和审答案的模型不是同一个(业内叫对抗式验证,写的容易对自己的活手软)。但AI 产品经理要判断的是:这个场景值不值得为可信多花一倍算力?哪条是“宁可慢也不能错”的红线?

循环二 · 出错了怎么收场? 报错别原样甩给用户,喂回给模型让它自己改了重试,这就是 ReAct。AI 产品经理要设计的是:自纠几次还不行就降级到什么程度?给用户看到的是一句人话兜底,还是一串红色报错?这是体验,不是技术。

循环三 · 人放在哪? 搞不定的转人工。但转人工不是认怂,是在喂饭——每次人工纠对,都产出一条“问题+错答案+对答案+错因”的高质量数据。AI 产品经理要设计的是:把人放在模型最没把握的那个位置,并且让他每一次纠正,都顺手变成喂给系统的数据。

循环四 · 怎么让它越用越好? 把转人工攒的纠错记录,归因、改提示词、补示例、再回归一遍,下次不再犯。这就是数据飞轮。这是四个里最值钱的一个,而且它纯粹是产品设计——飞轮不会自己转,是你在交互里埋好了“用户的每一次修改都被回收”,它才转得起来。

工程师给你四层可以调用的能力;AI 产品经理的活,是在这四层上做四个判断——红线、体验、人机分工、数据闭环。

别神化它:什么场景才值得上循环

讲到这你可能热血上头,想给所有功能都套个循环。打住——会判断“什么时候别上循环”,恰恰是 AI 产品经理比工程师更该有的清醒。

Addy Osmani 在 原文 里给了四条很实在的标准,全中才值得搭一个循环:① 这事每周以上重复(一次性的活,搭循环的成本都赚不回来);② 验证能自动化(有测试、有检查,能自己把坏结果挡掉,不靠你肉眼盯);③ token 预算扛得住(循环会反复试探、来回烧 token);④ agent 有能自查的环境(有日志、能复现问题、能把自己产出的东西跑起来看)。

业内也有泼冷水的声音,很值得听。YouTuber Ross Mike 几乎逐条反驳了“无脑上循环”:循环很烧钱(他说重度玩家一个月的 token 开销能到百万美元量级——这个具体数字是他的说法、未必精确,但方向是对的:全自动循环很贵);更要命的是“你以为你的需求文档写全了,但人根本不可能在一个文档里穷尽产品的所有细节”——于是循环会带着一堆错误假设一路狂奔,最后产出一个“能跑但不是你要的”东西,他形容这像一台老虎机。他的结论很犀利:循环只在“流程封闭、反馈固定、对错分明”的场景才靠谱——比如代码审查、批量生成同质的 SEO 页面;而需要创意判断、需要中途拿用户反馈的(比如从头做一个 App),全自动循环就是灾难。他有句话我很认同:“AI 能复制酱料,但造不出酱料。”

翻译成 AI 产品经理的语言,就一句话:别一上来就追求“全自动”。先挑一件“高频重复 + 能自动验证 + 风险可控”的小事,把它做成循环;那些需要创意、需要人拍板的环节,老老实实把人留在回路里。 什么该交给循环、什么必须人来兜,这个边界判断,才是你的价值。

一张 Loop 自查清单

下次你设计任何一个 AI 功能,先别急着挑模型,拿这四个问题过一遍——这其实就是在给你的护城河探坑:

  • 错了,怎么发现?(有没有校验、多路对照、护栏,还是它说啥是啥?)
  • 错了,怎么收场?(能不能自纠、降级,还是把报错甩给用户?)
  • 拿不准,谁来接?(人在哪个环节进来、什么情况转人工、他的纠正有没有被回收?)
  • 怎么让它越来越好?(出过的错有没有流回来、飞轮转没转,还是同一个坑踩一百遍?)

这四问,但凡一个答案是“没有、开环、不管”,那就是你产品里一个开环的口子——AI 产品的事故和平庸,基本都从这种口子漏出来。

最后:搭循环,但别交出判断

把功夫从“调模型”转到“设计循环”,是我认为 AI 产品经理在这一波最该完成的认知升级。但 Addy Osmani 在原文末尾的提醒,每个做 AI 产品的人都该记住——循环用爽了,有三个代价会悄悄找上门:

  • 理解债(comprehension debt):循环交付得越快,你没亲手写过、看过的东西就越多,“系统里实际有的”和“你脑子里真懂的”,差距越拉越大。
  • 认知投降(cognitive surrender):最舒服的姿态,恰恰是最危险的——循环能自己跑之后,人很容易就不再思考,直接照单全收它给的一切。
  • 而且,无人盯着运行的循环,也是无人盯着犯错的循环——最终验证的责任,永远在你手上。

Addy Osmani 给了一句特别精炼的话:设计循环,带着判断力去做是解药,为了逃避思考去做是毒药——同一个动作,相反的结果。他的原话是:“Build the loop. Stay the engineer.”(搭好你的循环,但别丢掉你的判断。)

对 AI 产品经理来说,这句话还要再加半句:搭好你的循环,但始终当那个做判断的人——而不是那个只会按下“启动”键、然后把一切交给机器的人。

AI 产品的上半场,大家比谁会调模型、谁的提示词更灵;可这些都在被飞快地商品化,迟早变成谁都用得起的水和电。下半场比的,是谁能在模型外面,一层层把循环搭对,又始终守住那个“什么该自动、什么该自己拍板”的判断

模型是借来的,会被拉平的;循环是你自己搭的,越搭越深的。

所以下次做 AI 产品,别只盯着“用哪个模型”了。多问自己一句—— 我,到底给我的产品,设计了几个循环;又有哪几个判断,我没敢交出去?

参考资料:

  • Addy Osmani,Loop Engineering(提出此词;含“何时才值得搭循环”判断、comprehension debt / cognitive surrender 与“Build the loop. Stay the engineer.”):https://addyosmani.com/blog/loop-engineering/
  • LangChain (Sydney Runkle),The Art of Loop Engineering(四层循环):https://www.langchain.com/blog/the-art-of-loop-engineering
  • Anthropic, Effective Context Engineering for AI Agents:https://www.anthropic.com/engineering/effective-context-engineering-for-ai-agents
  • Google “We Have No Moat, And Neither Does OpenAI”(泄露备忘录,SemiAnalysis 发布):https://www.semianalysis.com/p/google-we-have-no-moat-and-neither
  • BIRD 评测榜(人类 92.96% / o3-mini 严苛设定 44.81%):https://bird-bench.github.io
  • Self-Consistency(Wang et al., 2022):https://arxiv.org/abs/2203.11171
  • ReAct(Yao et al., 2022):https://arxiv.org/abs/2210.03629
  • 反方观点:YouTuber Ross Mike,WTF Is an “AI Agent Loop”? Genius or Hype?(属博主观点,仅供参考)
  • 经济护城河(economic moat):Warren Buffett 致股东信;飞轮效应:Jim Collins《Good to Great》(2001)

本文由 @Rowan 原创发布于人人都是产品经理。未经作者许可,禁止转载

题图来自Unsplash,基于CC0协议