惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

博客园_首页
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
有赞技术团队
有赞技术团队
G
Google Developers Blog
L
LangChain Blog
腾讯CDC
H
Help Net Security
Microsoft Azure Blog
Microsoft Azure Blog
F
Fortinet All Blogs
A
About on SuperTechFans
U
Unit 42
Microsoft Security Blog
Microsoft Security Blog
Blog — PlanetScale
Blog — PlanetScale
The Register - Security
The Register - Security
量子位
aimingoo的专栏
aimingoo的专栏
博客园 - 叶小钗
V
V2EX
雷峰网
雷峰网
Engineering at Meta
Engineering at Meta
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
Martin Fowler
Martin Fowler
大猫的无限游戏
大猫的无限游戏
爱范儿
爱范儿
月光博客
月光博客
T
The Blog of Author Tim Ferriss
CTFtime.org: upcoming CTF events
CTFtime.org: upcoming CTF events
酷 壳 – CoolShell
酷 壳 – CoolShell
V
Visual Studio Blog
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
Vercel News
Vercel News
D
Docker
T
Tailwind CSS Blog
C
Check Point Blog
小众软件
小众软件
I
InfoQ
宝玉的分享
宝玉的分享
博客园 - Franky
H
Hackread – Cybersecurity News, Data Breaches, AI and More
IT之家
IT之家
MongoDB | Blog
MongoDB | Blog
博客园 - 司徒正美
S
SegmentFault 最新的问题
Google DeepMind News
Google DeepMind News
云风的 BLOG
云风的 BLOG
博客园 - 聂微东
Recorded Future
Recorded Future
Recent Announcements
Recent Announcements
B
Blog RSS Feed
MyScale Blog
MyScale Blog

人人都是产品经理

为什么你的产品找不到差异化?90%的失败都卡在第一步上(下) – 人人都是产品经理, 3年从30万到1300万用户、获2200万美元融资,这个AI教育产品用“抽卡”破解了获客难题 – 人人都是产品经理, 园区招商系统怎么做才能真正帮到去化?我加了这一个功能,推广链接转发400次阅读过万 – 人人都是产品经理, AI大事件:OpenAI发完网络安全模型又搞药物研发,小鹏汽车要抓”DeepSeek时刻” – 人人都是产品经理, 电商不是卖货,是一场更残酷的产品经理实战 – 人人都是产品经理, 没想到,活动营销又回来了! – 人人都是产品经理, 为何All-in海外KOC:一场关于AI时代窗口期的豪赌 – 人人都是产品经理, 重新理解企业的内部协作 – 人人都是产品经理, 苹果的 AI 战略到底是什么? – 人人都是产品经理, 医疗智能体·第2讲——合规护城河:等保、PIPL与HIPAA的架构实战 – 人人都是产品经理, 向量知识库五步法:从“答非所问”到“精准回复” – 人人都是产品经理, 鸿蒙PC三方库构建总指挥HPKBUILD(sha)库为例 – 人人都是产品经理, 何时该用LLM?AI产品经理的LLM设计指南 – 人人都是产品经理, 医疗信息领域的需求方、决策方、准入方以及关注点(二) – 人人都是产品经理, 即梦涨价:一场被误读的「傲慢」 – 人人都是产品经理, 面试AI PM必答题:Hermes和OpenClaw的区别,如何讲清楚业务价值 – 人人都是产品经理, AI的下一张船票:世界模型——AI产品经理必须理解的技术拐点 – 人人都是产品经理, 小红书做GEO,怎么让AI信你?记住这 3 个重要信息 – 人人都是产品经理, 5 家印度 AI 初创公司,看看印度 AI 再做什么 – 人人都是产品经理, AI项目跨团队协作:产品技术业务如何不打架 – 人人都是产品经理, Agentic Workflow(智能体工作流):让AI从”答案生成器”变成”数字员工” – 人人都是产品经理, lycium_plusplus 项目全景解读:OpenHarmony 三方库构建的“大管家” – 人人都是产品经理, 从爆单救火到前置履约:两套预采策略,把生鲜大促履约效率拉满 – 人人都是产品经理, 什么时候该补货?我用一轮数据做了一个决定 – 人人都是产品经理, 从“机械兜底”到“动态分流”:AI客服重复进线治理的4大底层逻辑 – 人人都是产品经理, 抖音拼效率,红书拼洞察 – 人人都是产品经理, 全民狂欢与退潮——为什么龙虾这波热潮冷却得如此之快? – 人人都是产品经理, Stripe押注!MPP重塑全球支付 – 人人都是产品经理, 小红书GEO:AI引用你的内容,不是因为你对,而是因为你看起来可信 – 人人都是产品经理, 前百度副总裁押注办公Agent,日韩付费爆发,Manus迎来强劲对手 – 人人都是产品经理, 企事业单位数字化的业务供需本质 – 人人都是产品经理, 医疗智能体·第1讲——医疗信息化重构:从“辅助软件”到“自主智能体”的范式转移 – 人人都是产品经理, 粉丝量就是空气!!! – 人人都是产品经理, 用户说“薯片碎了”,机器回“要买吗?”:意图识别的翻车与破局 – 人人都是产品经理, RAG召回准确率从75到90 我做对了这三件事 – 人人都是产品经理, AI大事件:Anthropic改收费、OpenAI发安全版、手术机器人纳入医保、阿里发布”秒悟” – 人人都是产品经理, Chrome 推出 Skills 新功能,Agent 重塑上网方式 – 人人都是产品经理, GitHub前创始人拿了a16z的1700万美元,做Agent时代的Git – 人人都是产品经理 拷贝或克隆其他 Flutter OH 项目到本地后无法运行 – 人人都是产品经理, 优惠券设计:优惠券创建 – 人人都是产品经理, 不用死磕文档!AI 助手 1 小时搞定飞书 CLI 安装 + 配置 + 知识库 – 人人都是产品经理, 用小龙虾做竞品分析报告:从2天到20分钟,我是怎么做到的 – 人人都是产品经理 用小龙虾做市场分析报告:搞懂这3个公式,市场规模不再靠猜 – 人人都是产品经理, 你早就在做 Harness 工程,只是不知道它叫这个名字 – 人人都是产品经理, Think Long就够?你可能想多了! – 人人都是产品经理, 货代SRM实战:供应商准入怎么做,才能让资源池不是通讯录而是可交付网络? – 人人都是产品经理, 如何做好用户调研?详解基本技巧 – 人人都是产品经理, 木鸟、途家、美团对打,平台春天行动开“卷” – 人人都是产品经理, 入职才发现公司不靠谱?小红书从业者求职避坑指南 – 人人都是产品经理, 美国 AI 三巨头联手封堵,中国 AI 突围之路在何方 – 人人都是产品经理, 小红书,放在需求对面的镜子 – 人人都是产品经理, AI 会带来大规模失业吗? – 人人都是产品经理, 从出单到补货前,我第一次犹豫:该不该放大? – 人人都是产品经理, Flutter 三方库鸿蒙化适配:5 种高效检查方式,快速判断是否需要适配 – 人人都是产品经理, 从做产品进阶拿结果:医美机构产品经理转岗科室运营经理 – 人人都是产品经理, 阿里HappyHorse,一场关于“Token经济”的阳谋 – 人人都是产品经理, To B AI:客户留存落地的观察与思考 – 人人都是产品经理, AI产品的“生命线”——数据采集、标注、清洗的产品化设计 – 人人都是产品经理, 谈谈AI Agent(二):当“孩子”能自己“体验世界”时,你该学什么? – 人人都是产品经理, UI/UX设计师的3层能力进阶,前两层让你活下来,第三层…才是真正的分水岭 – 人人都是产品经理, 2分钟 → 30秒,效率提升75%:B端产品经理如何用「规则枷锁」驯服AI幻觉? – 人人都是产品经理, 还没来得及学OpenClaw,来了个更猛的:Hermes Agent – 人人都是产品经理, AI日报:宇树机器人跑出10m/s刷新世界纪录 – 人人都是产品经理, 一文说透基金互金如何用情绪价值引导用户决策做转化 – 人人都是产品经理, 当浏览器开始替你”看”网页:AI 浏览器正在亲手拆掉它脚下的那张网 – 人人都是产品经理, 0代码,一天时间我Vibe Coding了个网站 – 人人都是产品经理, Hermes 和 OpenClaw 之争,Agent 的能力应该“装上去”还是“长出来”? – 人人都是产品经理 视频生成的“桌子”,字节Seedance 2掀完,阿里快乐马掀 – 人人都是产品经理, 从听不懂到完全信任:我的 Codex 深度产品体验 – 人人都是产品经理, 当虚拟偶像有了北京户口,与真人偶像还有什么区别? – 人人都是产品经理, 会说,远远比会做更重要 —— 对 SBTI 爆火现象的五层观察 – 人人都是产品经理, AI产品经理必看:当“搭环境”比“选模型”更重要,你的认知还在2024年吗? – 人人都是产品经理, 2026年AI产品商业化核心逻辑:从功能demo到规模化营收的3个必破卡点 – 人人都是产品经理, 京东围绕供应链,卷起裤腿下场的那些事儿 – 人人都是产品经理, SBTI一夜刷屏:它赢在了“太会说人话” – 人人都是产品经理, 折扣零售的真相:不是便宜,而是价值感! – 人人都是产品经理, 和甲方吵了一架,最后加钱做了——我学到的ToB产品经理生存法则 – 人人都是产品经理, 和几位小红书操盘手聊了8小时,干货全在这 – 人人都是产品经理, 智谱GLM-5.1登场,开源模型首超Opus4.6!!! – 人人都是产品经理 Anthropic收入凭什么反超OpenAI,终于有人把这事说清楚了 – 人人都是产品经理, 史上最有故事感的技术报告——Claude最强模型Mythos 7个极其精彩的细节 – 人人都是产品经理, 模型不是壁垒,Harness 也不是 – 人人都是产品经理, 抖音本地生活业务思考21 – 人人都是产品经理, Superpowers:145k Star的AI编码框架,到底是什么来头? Superpowers:145k Star的AI编码框架,到底是什么来头? – 人人都是产品经理, OpenAI 的路走错了,Anthropic Harness 解法启示:模型需要实践专科生 – 人人都是产品经理, 画原型图的前一步:设计站点地图 – 人人都是产品经理, 给 DeepSeek 的最后一封催更信 – 人人都是产品经理, 手把手教你用 Claude Code 搭建 AI 营销团队:5 个 Agent、12 项技能,独立完成研究、写作、设计全流程 – 人人都是产品经理, 你以为大模型在学语言?不,它在重新发明语言学 – 人人都是产品经理 所谓Skill,不过是AI时代的工业垃圾 – 人人都是产品经理, 聊一聊内容传播的几个方法 – 人人都是产品经理, 当平台开始吃掉生态:从 OpenClaw 被封杀,读懂 Anthropic 的这盘棋 – 人人都是产品经理, 你装了 10 个 AI 插件,Obsidian 还是一个文件夹 – 人人都是产品经理 关于AI智能体架构演进的系统性思考:从单体试水到多体协同的重构 – 人人都是产品经理, 当“人”变成Skill,我们又该何去何从? – 人人都是产品经理 Mythos 事件:前沿 AI 治理的意外实验 – 人人都是产品经理, 货代CRM:信用与风险管理怎么做,才能把坏账风险拦在放货之前? – 人人都是产品经理, 从HR收集自拍照到员工自助录入——我见证了园区人脸识别从”不可用”到”真好用”的全过程 – 人人都是产品经理 千问闯关AI混沌期:阿里画靶,吴嘉张弓,马云射箭? – 人人都是产品经理,
我让 AI 读了 52 篇论文,这是我学到的关于 Loop 的三件事 – 人人都是产品经理
yan · 2026-06-23 · via 人人都是产品经理

当AI遇上神经科学论文,万字解读的自动化革命正在上演。本文揭秘了一个名为Loop的智能协议系统如何通过五步流程、独立评审机制和客观评价标准,将52篇论文的深度解读工作量从104小时压缩至近乎自动化完成。更关键的是,作者用实战案例揭示了哪些任务适合AI自动化,哪些仍需人类创意的不可替代性——这是每个试图用AI重塑工作流的产品人都必须掌握的边界判断。

我手上有 52 篇神经科学经典论文的 PDF。我想把每一篇变成一篇中文深度解读文章——不是摘要,是万字级别的、带概念工具箱、带数据引用、带独立判断的完整解读,输出为自包含的 HTML 文件。

手动做?第一篇花了我 2 小时,第二篇还是 2 小时。52 篇就是 104 小时,不现实。

让 AI 做?一个 prompt 搞不定。这个任务有五步:读 PDF 全文、规划文章结构、撰写内容、组装 HTML、检查质量。每一步都依赖前一步的结果,而且”检查质量”这件事不能跳过——AI 写的东西质量波动很大,你不检查就不知道它漏了什么。

所以我写了一个协议(Protocol):告诉 AI 对每篇论文执行这五步,做完一篇检查一篇,不过关就修改,改完再检查,过了就下一篇。

这就是 Loop——不是跑一次祈祷结果好,而是跑完就检查、不行就重来

Loop 的核心不是”循环”这个动作,而是退出条件:什么情况下算”够好了,可以下一篇”?没有退出条件的循环只是死循环。(当然不是说死循环没有价值,现在死循环有死循环的价值

一个 Loop 长什么样

跑了三个 Loop 之后(两个成功,一个失败),我发现一个能跑起来的 Loop 由五个部分组成:

Protocol是写给”没见过这个项目的 AI”看的操作手册。不是给你自己的备忘录——路径要写绝对路径,工具调用要给示例代码,恢复逻辑要显式写明。判断标准:如果你把这个文件发给一个完全不了解项目背景的朋友,他能不能照着跑起来?

  • Skill(Maker)是执行任务的指令模板。在我的例子里是论文解读 Skill,定义了五个阶段的写作流程和 HTML 模板。Skill 的质量直接决定首轮通过率——Skill 写得好,Checker 几乎没事做。
  • Checker是独立的评审 Agent,后面会详细讲为什么”独立”这两个字是关键。
  • State是一个 JSON 文件,追踪每个 item 的状态。它的作用不只是记录进度,更重要的是让 Loop 可以中断和恢复——任何 AI 读到这个文件,都知道从哪里继续。
  • Reference是一个你手工做好的范例。它的约束力比规则强得多:规则说”概念工具箱要用人话解释术语”,范例直接告诉你”人话”长什么样。

这五个部分里,最重要的是 Rubric(评审标准)

Protocol 怎么写、State 用什么格式、Checker 怎么调用——这些都是工程问题,花点时间就能搞定。但 Rubric 不一样:它决定了”什么算好”。Rubric 清晰,Loop 就顺利;Rubric 模糊,Loop 就是在原地打转。

我的论文解读 Loop 之所以 94% 首轮通过,不是因为 Protocol 写得多细,而是因为 8 条 Rubric 每一条都可以客观判定——”术语有没有中文翻译”不需要主观判断,”HTML 结构是不是 .page > .layout > .main-content”看一眼 DOM 就知道。而我的微世界 Loop 失败,本质上是因为写不出好的 Rubric——”这个预测问题是否能触发认知冲突”无法客观判定。

所以设计 Loop 的第一步不是写 Protocol,而是写 Rubric。如果你能列出 5-10 条可以被一个陌生人(或陌生 AI)客观判定 pass/fail 的标准,这个任务就适合 Loop。如果你列不出来,先别急着搭 Loop——先搞清楚你到底要什么。

接下来的三件事,就是我在围绕 Rubric 搭这个结构时踩过的坑。

第一件事:你的 Checker 可能是假的

设计 Loop 的第一个决定是:谁来检查?

最直觉的做法是让做事的 AI 自己检查自己的输出。很多教程也是这么教的:在 prompt 里加一句”现在忘掉你刚才写的内容,以一个严格评审员的身份重新审查这篇文章”。

我最初就是这么做的。结果发现一个问题:它几乎从不给自己打 fail。

原因很简单——它知道自己的意图。当它看到一个段落写得含糊时,它能”脑补”出自己想说什么,然后判定”虽然写得不够清楚,但意思到了”。它不是在评审一篇陌生的文章,它是在回忆自己几秒钟前的思考过程。

这就像让一个学生批改自己的考卷——他知道自己想写什么,所以总觉得自己写对了。

修复方法:用一个全新的、独立的 AI 实例来做 Checker。在 Claude 里,这意味着用 Agent 工具生成一个子 Agent——它有自己独立的上下文,完全没见过主 Agent 的生成过程。给它的只有两样东西:

1. 生成好的 HTML 文件

2. 八条评审标准(能不能独立理解、数据是否精确、术语是否有中文翻译、HTML 结构是否正确……)

它不知道这篇文章是怎么写出来的,不知道作者”想表达什么”,它只看到成品。这才是真正的评审。

独立上下文不是优化,是正确性要求。告诉同一个 Agent “假装忘记”不等于它真的忘了——上下文还在那里,它的判断必然受污染。这个错误在几乎所有 Loop 教程里都存在,但很少有人点破。

第二件事:Checker 拦住的不是”烂”,是”盲点”

协议写好,跑起来。52 篇论文全部完成后,我回头看数据:

  • 49 篇:在第一轮就通过了全部 8 条评审标准(pass 8/8)
  • 3 篇:在第一轮被 Checker 打回,第二轮修改后通过

被打回的 3 篇分别是什么问题?

  • Bliss & Lømo (1973),LTP 论文:概念工具箱里漏了 CaMKII(钙调蛋白依赖性激酶 II)的解释
  • Warrington & Shallice (1969),短时记忆论文:漏了 WAIS(韦氏成人智力量表)的中文翻译和全称
  • Felleman & Van Essen (1991),皮层层级论文:漏了 RGC(视网膜神经节细胞)等缩写的解释

三个全是同一类问题:特定专业术语没有解释全

这说明什么?

第一,Maker(生成器)本身已经够好了。94% 的首轮通过率意味着论文解读的 Skill(指令模板)写得足够详细,AI 不需要反复修改就能产出合格的文章。如果你的 Checker 每次都拦住大量问题,说明你的 Maker 需要重写——不是多跑几轮能解决的。

第二,Checker 的真正价值是抓系统性遗漏。这三次 fail 都不是”文章写得烂”,而是在某个具体知识点上有盲区。这种盲区靠主 Agent 自检是发现不了的——因为它如果知道 CaMKII 需要解释,当初就会写进去。只有一个”不知道作者意图”的独立 Checker,才会客观地发现”这里出现了一个没解释的缩写”。

第三,Checker 的成本是可控的。3/52 = 5.8% 的重审率意味着 Checker 子 Agent 平均每 17 篇才需要多花一轮的 token。这比”不检查直接发布然后人工返工”便宜得多。

第三件事:有些任务不该 Loop 化

同一批 52 篇论文,我还尝试过另一个 Loop:给每篇论文生成一个”交互式微世界”——不是让读者读文章,而是让读者亲自体验论文的论证过程。比如 FFA 论文,做成一个淘汰赛游戏:给你看脸和物体的 fMRI 数据,让你预测结果,逐步排除替代假说。

我设计了完整的协议:5 种交互模式(淘汰赛、双重分离、证据累积、模拟体验、概念构建)、7 条 Checker 标准、详细的 HTML 组件规范。从协议设计的角度看,它比论文解读的 Loop 还完善。

AI 跑出了第一个产出。我看了一眼,直接否掉了整个 Loop。

不是因为产出有 bug,而是因为它不是我想要的东西。交互体验的设计空间太大了——同一篇论文可以做成 100 种完全不同的交互方式,每一种都”符合协议”,但大多数都不是好的学习体验。协议能约束格式(必须有预测点、必须有计分板、必须有自测题),但约束不住创意(什么样的预测问题能真正触发认知冲突?什么样的交互节奏能让人”啊哈”?)。

这就是 Loop 的适用边界:Loop 能工作的前提是,输出空间小到 Checker 能覆盖。

论文解读的输出空间很大,但被 Skill 的 10 个固定章节 + 8 条 Checker 标准压缩到了可管理的范围。代码的输出空间更大,但被测试用例压缩到了”通过/不通过”。而”设计一个学习体验”的输出空间几乎是无限的——你可以检查它是否有预测点,但你无法检查这个预测点是否”问得好”。

如果你的 Checker 只能检查格式不能检查内容质量,那这个任务可能不适合 Loop。先手工做一个满意的范例,确认你能说清楚”好”长什么样,再决定是否 Loop 化。

最后

Loop 不难,难的是知道什么时候该用、什么时候不该用。

52 篇论文解读告诉我:如果任务结构清晰、退出条件可检查、有参考范例,Loop 的效果出奇的好——94% 首轮通过,剩下 6% 也在第二轮解决。总耗时从预估的 104 小时变成了”写协议 2 小时 + 跑完等结果”。

但交互式微世界告诉我:如果任务本质上是创意性的,输出好坏取决于品味而非标准,那再完善的协议也救不了你。这时候正确的做法不是设计更复杂的 Loop,而是承认这个任务需要人来做。

回过头看,Loop 其实不是什么 AI 时代的新发明。写 Protocol 就是写 SOP(标准作业程序),写 Rubric 就是写验收标准,Checker 就是质检,State 就是工单系统——这些东西在制造业和软件工程里存在了几十年。变的只是执行者从人换成了 AI,以及因此带来的一个新问题:怎么让一个没有常识兜底的执行者在无人值守的情况下保持质量。所有关于 Loop 的技巧,归根到底都在回答这一个问题。

知道边界在哪,比知道怎么写 Loop 更重要。

本文由 @yan 原创发布于人人都是产品经理。未经作者许可,禁止转载

题图来自Unsplash,基于CC0协议

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务