惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

N
News and Events Feed by Topic
Malwarebytes
Malwarebytes
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
C
Cybersecurity and Infrastructure Security Agency CISA
F
Future of Privacy Forum
C
Cisco Blogs
T
The Exploit Database - CXSecurity.com
A
Arctic Wolf
S
Securelist
K
Kaspersky official blog
S
Schneier on Security
T
ThreatConnect
T
Tenable Blog
Spread Privacy
Spread Privacy
T
True Tiger Recordings
AWS News Blog
AWS News Blog
F
Fox-IT International blog
量子位
T
Threatpost
V
Vulnerabilities – Threatpost
C
CERT Recently Published Vulnerability Notes
Cisco Talos Blog
Cisco Talos Blog
GbyAI
GbyAI
宝玉的分享
宝玉的分享
腾讯CDC
G
Google Developers Blog
aimingoo的专栏
aimingoo的专栏
Cyberwarzone
Cyberwarzone
有赞技术团队
有赞技术团队
S
SegmentFault 最新的问题
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
V
Visual Studio Blog
U
Unit 42
雷峰网
雷峰网
cs.CV updates on arXiv.org
cs.CV updates on arXiv.org
Simon Willison's Weblog
Simon Willison's Weblog
O
OpenAI News
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
The GitHub Blog
The GitHub Blog
The Register - Security
The Register - Security
MyScale Blog
MyScale Blog
小众软件
小众软件
A
About on SuperTechFans
Last Week in AI
Last Week in AI
Y
Y Combinator Blog
博客园 - 三生石上(FineUI控件)
美团技术团队
Google Online Security Blog
Google Online Security Blog
P
Proofpoint News Feed
MongoDB | Blog
MongoDB | Blog

人人都是产品经理

半年前我就在做Harness Engineering – 人人都是产品经理, 拉勾破产:一段互联网创业简史 从一次面试的“卡壳”,看全球化浪潮下tob市场人的能力重构 中企赴波兰展业:财税数字化蓝图 – 人人都是产品经理, AI互联网日报:Anthropic盈利和OpenAI上市,AI行业要变天了/今日头条对头条百科业务进行裁员调整 – 人人都是产品经理, 2026重塑产品-周期篇:它是静止的还是动态的? – 人人都是产品经理, 当90%的工程师用AI写代码,AI 组织的管理者要怎么办? – 人人都是产品经理, 货代单证模板实战:如何把「排版权」还给业务,又不丢掉数据准确性? – 人人都是产品经理, AI 时代,构建本地AI知识库 – 人人都是产品经理, 面试、述职、汇报时,总有人问:“你的分析结论,怎么落地闭环?”三种模式,轻松回答! – 人人都是产品经理, 一张图讲透:预算治理架构 – 人人都是产品经理, 我们是行业里最早拥抱AIGC的一批,三年后却越来越差 – 人人都是产品经理, AI 应用搭建平台的知识库竞品分析:RAG 功能为什么会这样设计? ——以百度千帆与 Lyzr AI 为例 – 人人都是产品经理, 中国Agent产业面临的四重不确定性挑战——《重构与崛起——OpenClaw时代的中国Agent产业生态报告》解读六 – 人人都是产品经理, 单枪匹马年入百万美金:拆透海外顶流创客 Dan Koe 的产品逻辑与超级个体法则 – 人人都是产品经理, 产品经理的AI护城河:不是写Prompt,是接住那颗从未变过的人 – 人人都是产品经理, AI时代,产品经理的AI落地指南! – 人人都是产品经理, AI互联网日报:Spotify把AI翻唱推向版权灰区/Google AI眼镜接近可用/京东或20亿英镑竞购英国电商 – 人人都是产品经理, 一文看懂VLA:自动驾驶的下一个范式 – 人人都是产品经理, 终于,微信公众号也不让你留个人微信号了 – 人人都是产品经理, 中国Agent产业发展趋势——《重构与崛起——OpenClaw时代的中国Agent产业生态报告》解读五 – 人人都是产品经理, AI还原页面设计怎么做?我实测后总结了这套「块状精修法」! – 人人都是产品经理, AI用户体验要素二:那些无法忽略的UI交互行为 – 人人都是产品经理, 货代员工管理实战:如何把考勤、加班和人力成本做成可控的经营数据? – 人人都是产品经理, 月薪5万也招不到?AI产品经理的真实薪资与隐形门槛 – 人人都是产品经理, 大多数AI产品,其实是在给自己人做的 – 人人都是产品经理, 运营人必懂的3步数据分析逻辑,一线业务应用指南 – 人人都是产品经理, 我的AI写稿全流程公开 – 人人都是产品经理, 从 Gemini 实时多模态狂欢降温:B 端产品经理该怎么看这场 Omni 进化 – 人人都是产品经理, AI搜索没有杀死广告。它只是把广告藏进了你信任的那句话里 – 人人都是产品经理, 跨境税务系统:边界、能力与风险前置06 如何创建一家AI Native公司?Anthropic刚发的这份手册,把答案说清楚了 – 人人都是产品经理, 跨境账务系统:在不确定中形成可解释结果05 – 人人都是产品经理, Electron-OH 37.2.1 正式发布:鸿蒙PC开发体验全面升级,跨端开发再提速 – 人人都是产品经理, Notion CEO重新定义了一件事:什么样的人在AI时代真正值钱 – 人人都是产品经理, Notion CEO重新定义了一件事:什么样的人在AI时代真正值钱 – 人人都是产品经理, AI搜索的广告比你想象中更危险:它连你的怀疑都省了 – 人人都是产品经理, 做了一年客服型外呼 Agent,我发现旧的效果评估体系正在失效 – 人人都是产品经理 我以为用户好评是成功,直到我发现它背后藏着一个致命的陷阱… – 人人都是产品经理, 谷歌 I/O 炸场看完了:别再用百万级的自嗨对话框去增加企业的翻译税 – 人人都是产品经理, AI写代码的速率是人的10倍,端到端却只快了2倍:产品经理视角下,没人讲清楚的3件事 – 人人都是产品经理, 提示词的本质:不是“咒语”,而是 AI 产品设计中的需求表达能力 – 人人都是产品经理, 和代运营合作5年后,我真的不建议大健康私域再找代运营了! – 人人都是产品经理, 场景不同,测评方法需要因地制宜:最新摸索的测评“四象限法则”分享 – 人人都是产品经理, 为什么很多人抄爆款,越抄越不像? – 人人都是产品经理, 妙鸭AI生图团队解散:从”时代宠儿”到”被遗忘者”的启示 – 人人都是产品经理 构建数字孪生生态:从封闭系统到开放平台 – 人人都是产品经理, 一文讲透医疗 AI 的隐私合规:技术、场景、落地、避坑 90%的模型微调是浪费钱的——我说“不调” – 人人都是产品经理, 企业可以这样落地 AI 能力(二):技能蒸馏 – 人人都是产品经理 鸿蒙 HarmonyOS 6.1.1 (API 24) Beta1 发布:开发能力全面升级,构建更高效智能生态 – 人人都是产品经理, Claude 三件套:从想清楚,到看得见,到做出来。它要把”想法变产品”全包了 Claude 三件套:从想清楚,到看得见,到做出来。它要把”想法变产品”全包了 – 人人都是产品经理 为什么餐厅都在劝你去买团购券? – 人人都是产品经理, 最近几个月的AI大模型独立应用实践-1 – 人人都是产品经理, 最近几个月的AI大模型独立应用实践-1 – 人人都是产品经理, 别让模型拖后腿:我用6年产品经验总结的AI选型法则 – 人人都是产品经理, 我做了一个对比实验:为什么同一个模型,两个 AI 工具产出差距如此巨大 – 人人都是产品经理, AI用户体验要素一:从“操作工具”到“委托代理人” – 人人都是产品经理, 不是教你用 AI 写 PPT,是把 AI 训练成”你自己” – 人人都是产品经理 Google I/O 2026 XR篇:最轻的眼镜没有界面 – 人人都是产品经理, 深聊100家教育企业后,我总结了7种链路拆解线索获客链路 – 人人都是产品经理, GEO 产品如何用 RAG 提高品牌命中率? – 人人都是产品经理, 跨境系统 vs 国内系统:差异、坑与产品心法07 – 人人都是产品经理, 年增速25%、线上占比冲60%,拆解AI心理疗愈的商业底层逻辑 – 人人都是产品经理, Agent 工作流,踩过的几个坑 – 人人都是产品经理, Vibe Coding 之后,真正拉开差距的是“AI 项目管理能力” – 人人都是产品经理, 新个体如何运营好小红书账号? – 人人都是产品经理, 从 OPC 到 OPD:企业如何建立 AI 原生部门? – 人人都是产品经理, Qwen3.7-Max来了:一个拼命干活的AI 一套代码走全球:汽车出海系统架构的“避坑”指南 – 人人都是产品经理, 2026,关于小红书反常识的实践 – 人人都是产品经理, LLM Wiki实战篇:少花token,多沉淀知识 – 人人都是产品经理, 我做了一个本地运行的甘特图工具,顺便让 AI 帮我拆项目计划 – 人人都是产品经理, RAG踩坑实录:很多坑开发不会主动告诉你 – 人人都是产品经理, Google I/O 2026 AI篇:当Google说”AI变得更聪明”,它其实在说”界面可以消失了” – 人人都是产品经理 什么是无可替代的业财一体化产品? – 人人都是产品经理, 「不就是发个货?」——这句话坑过多少电商产品 – 人人都是产品经理 企业拥抱Agent行动指南——《重构与崛起——OpenClaw时代的中国Agent产业生态报告》解读四 – 人人都是产品经理, 当泡沫散尽,B端AI公司里值钱的只剩这一种人 2016怀旧潮:一场对“真实人格”的系统修复 – 人人都是产品经理, 即时零售:零食品牌的下一场“抢滩登陆战” – 人人都是产品经理 大模型时代的认知反转:我们为何从渴望“千人千面”转向渴求“稳定可控” – 人人都是产品经理, 美团的TOB商家运营模式拆解——把成熟的东西重新拆解一遍,就能发现新东西(一) – 人人都是产品经理, 每提问一次亮灯两分钟,生图一次充满一部手机:请收起你们的算力自嗨 – 人人都是产品经理, 「招投标AI落地观察」暗箱里的算力 —— AI时代招标文件的潜规则识别 – 人人都是产品经理 属于小红书的种草时代,结束了 – 人人都是产品经理, 如何用AI打造一家自我进化的公司 – 人人都是产品经理, 如何用AI打造一家自我进化的公司 – 人人都是产品经理, 人形机器人拾取沙发缝隙掉落物件 – 人人都是产品经理, 人形机器人拾取沙发缝隙掉落物件 – 人人都是产品经理, “人货场模型”深度拆解:分析框架、建模思路、业务建议 – 人人都是产品经理, 万字干货:这可能是全网最实战的「用 Claude Code 做产品」完整方法论 – 人人都是产品经理, AI PM 的 PRD,越写越像半截草稿 – 人人都是产品经理 AI产品如何从 Skill 走到虚拟员工? – 人人都是产品经理, FDE 是什么:不是销售工程师,也不是咨询顾问 – 人人都是产品经理 建设中医科研数据库和西医科研数据库,到底差别在哪?(一) – 人人都是产品经理, 图片转 Prompt · Web Coding 工作流 – 人人都是产品经理 一文看懂VLM:自动驾驶里那个会看图说话的AI – 人人都是产品经理, 模型越强,为什么 Agent 框架反而更重要? – 人人都是产品经理,
AI执行规范只有70%?剩下的30%靠系统“护栏”兜底,一个AI产品经理的可靠性设计笔记 – 人人都是产品经理,
Barry设集屋 · 2026-05-25 · via 人人都是产品经理

AI产品的可靠性挑战正在颠覆传统产品思维。从得物团队的实战数据到Bloomberg Law的行业警示,本文深度剖析AI在执行规范时70%的失效率如何威胁业务闭环,并揭示从Prompt优化到工程兜底的认知跃迁——用确定性系统对抗概率性输出,才是AI产品经理真正的价值锚点。

1. 我先给自己泼盆冷水:AI不是万能执行者

做AI产品这两年,我一度挺乐观的。觉得只要把Prompt拆细、RAG搭好,再配上精心设计的few-shot示例,模型应该能跟一个干了三年的老员工差不多——稳住底线,不出大错。甚至跟算法同事吹过牛:“你看,让GPT记几条规范,它背得比我还熟。” 结果呢?上周五就栽了。我拿一个中等体量的项目做压力测试,故意让AI在长上下文中连续跑15步推理。前5步一切正常。第6步开始,它把前面确定的输出格式忘了。第11步直接凭空捏了个不存在的参数。翻日志一看,上下文窗口已经被之前无关的讨论撑到快炸了。模型就像个上了年纪的图书管理员,不是不认真,是书太多,找不着了。

真正让我心头一紧的,是得物团队那个数据。他们统计过,在项目紧张的情况下,人工盯规范的比率会掉到60%–70%,而AI所谓“记忆”的规范执行率也只有70%–80%。注意,这不是实验室里测出来的,是真实上线跑出来的。我算过一笔账:如果一个任务需要遵守10条规范,70%的执行率意味着平均每三次处理就有一次会漏掉至少一条规则——而业务场景里往往是一环扣一环,漏一条就可能整个流程崩塌。上周Bloomberg Law有篇报道也在谈这个,说成长阶段的公司需要可扩展的AI合规框架,关键是一样的:你不能指望模型自己管住自己,尤其是在上下文膨胀、压力陡增的时候。

坦白讲,这盆冷水泼得值。我一直以为“把规范写进系统”是锦上添花的事——先把模型能力搞对,再考虑工程兜底。现在发现这顺序反了。模型的不确定性不是Bug,是它的天性。而我们这些做产品的,最怕的就是把产品建立在天性之上。70%不是不够好,是在生产环境里它等于“随时可能出事”。当时我意识到,如果继续相信AI能靠自我纠错把执行率拉满,那最终被坑的只会是我自己,以及信任这个产品的用户。所以得换个思路:别指望模型记住每一条规则,用工程的确定性去兜底不靠谱的AI记忆。

2. 为什么AI也会“失忆”?我拆了三个场景

我拆了三个场景。先说人工盯规范。这条防线看着最底层,其实最脆。项目一紧张。人就会抄近路。不是团队不负责。是大脑根本不擅长这种活——每行都要对一遍规则。上周复盘一个紧急上线,开发在压力下把样式规范检查表跳过了三页。理由:先跑通再说。我们拉了数据。正常节奏下人工遵守率能到80%左右。一旦赶deadline,直接掉到60%-70%。这已经拼尽全力了。指望人肉维持标准?等于把铁轨铺在沙子上。今天能跑,明天就不一定。我那时才明白,“规范”如果只写在文档里、贴在墙上,它等于不存在。

AI的记忆。喂同样一份规范文档,简单任务能记住95%,可一旦任务复杂——比如一个页面十几个组件,每个组件三四层交互——AI开始丢东西。它不会告诉你。输出看起来像模像样。但某一步的圆角半径变成0px。或者某个按钮的点击区域尺寸缩了。我找工程师做了压力测试。中等复杂度下,AI执行率只有70%-80%。每五次执行,就有一到两次走样。对严谨的交付流程来说,这个波动是灾难——没人知道哪次上线会带个小尾巴。我意识到,AI的“记忆”不是硬盘。更像会议上的速记员:记着记着,前面的话被后面的话盖掉了。

复杂需求。我试过一个比较大的模块重构,让AI先拆成20个子任务,每个子任务对应几条规范约束。前三个很顺。到第七八个,它开始把第四步的“禁用弹窗”条件错误地延续到第十一步。而且这种退化不是线性的——上下文冲到某个长度阈值时,执行率断崖式下跌。像开会开到后半程,突然想不起来开头定下的原则。上周四我看到一篇报道,研究者提到AI驱动的漏洞利用窗口已经缩小到几小时。这背后是模型对上下文敏感度的脆弱——复杂任务里一点点偏差就会被放大。对我来说,这个场景直接指向一个结论:需求越大,AI越容易“失忆”,而且没人能预测它会在哪一步忘。所以靠模型自己记住每一条规则,根本不现实。我不再指望加几个few-shot示例就能搞定。

3. 观念转变:从“相信AI自我纠错”到“设计系统强制兜底”

拆完那三个场景,我愣在工位上。不是技术问题。是方向问题。我一直在琢磨怎么让AI记住更多规范。怎么把Prompt写得滴水不漏。怎么设计更好的few-shot让模型自己纠错。但事实摆在这里:上下文一冲,模型就是会忘。而且这种遗忘,不是靠补课能解决的。上周四那条新闻让我更确信——攻击者响应时间压缩到几小时,我们却还指望AI在执行到第18步时记得第3步的约束。这不合理。然后看到得物团队的Harness概念。第一反应:这名字起得挺硬。但读完之后头皮发麻。他们根本不纠结怎么让AI记住规范,直接写代码做“护栏”。把执行规范变成系统级检查机制。在AI输出前后用hooks和自动化工具拦截、校验。这不是优化。这是换了一条路。

这个转变意味着什么?我给自己打了个比方。之前我的思路是:给AI一本交通规则手册,让它背下来。然后指望每次上路它都自觉遵守。但现实呢?AI开到第10个路口时,可能已经把“红灯停”记成了“黄灯也停”。Harness的思路:别只靠司机的觉悟。直接在路上装红绿灯、装摄像头、装自动栏杆。你AI可以开得很快,但到了红灯口,系统物理上不让你过。这就是产品思维的分水岭。我过去总想“教好”模型,现在我知道,有些约束天生不适合靠模型“记住”,必须靠系统强制执行。比如规范里明确写“用户未登录时禁用弹窗”。这种边界是硬约束。不应该留给AI去判断“这个场景下弹窗算不算违规”。直接写一个hook,在AI输出任何包含弹窗逻辑的代码之前,先检查上下文里是否包含“已登录”条件。不满足就拦截,返回一个标准错误信息。简单粗暴。但可靠。

想通这一点后,我的角色定义也变了。以前AI产品经理的核心工作是写Prompt、调RAG、选few-shot,本质上是在给模型当“补习老师”。现在我得重新画一条线:哪些规范可以放心交给AI去灵活执行,哪些必须由系统强制托管;哪些责任可以放权给模型的泛化能力,哪些必须由工程团队写死。我的判断标准很简单:凡是涉及用户安全、合规、核心业务逻辑的硬约束,全都交给Harness;凡是风格偏好、排版美观、文案语气这类可以容忍变化的,才让AI自己发挥。这个分类本身就是产品决策,而且每一步都要跟算法、工程、法务反复确认认知一致——因为一旦你把一条硬约束放给了模型,后面出了事故,没人会怪模型,只会怪产品经理没有做好兜底。有了这个认知框架,我才真正理解什么叫“工程的确定性对抗AI的不确定性”。下一节,我要动手搭“护栏”了。

4. 落地“护栏”实战:hooks、自动化与灰度节奏

想清楚那条线。动手。第一个动作特别朴实:代码生成后、合并到主分支之前,插一个自动化检查的 hook。之前团队里人工遵守规范的比率撑死了六到七成。AI 自己记规范也就七八成。等于每十次就有两三次漏掉关键约束。hooks 逻辑?简单。把安全规则、命名规范、敏感信息过滤这些“高频率、低容忍”的东西写成确定性的校验脚本。AI 输出的东西先过一遍脚本。违反的直接拒绝。返回具体的错误信息让人工修正——别让 AI 自己瞎改。上周我拿一个小模块试跑。头三天就拦住了六次误用敏感接口的情况。换成以前,这些错得等到测试上线才被发现。代价是前端要多写几百行校验代码。但跟反复返工的成本比起来,这笔账太划算了。

灰度节奏是我额外加的一道保险。我没敢一口气全量上 hooks。先挑了一个中等复杂度的子模块试跑。每天盯两个指标:坏 case 率和开发效率变化。第一个星期坏 case 率从 12% 直接降到 1.5%。但开发效率也降了 8%。每次被拦下来,人得盯着错误信息去改。流程变长了。我跟算法同学商量,把校验报错的信息格式改成直接定位到行号+建议修正代码。开发效率很快又拉回 95%。这时候我才敢往其他模块铺。刚好看到 5 月 19 号那篇关于 AI 漏洞窗口缩小到小时级别的报道。我更加确信了:威胁响应窗口在变短。依赖人工或 AI 记忆去守底线已经来不及。只有工程层面的确定性检查能兜住。

执行率接近 100%。但这还不是最爽的。最爽的是“失忆率”的变化。以前 AI 稍微一大段上下文就忘掉前几条规范。现在 hooks 把基础约束写死之后,喂给大模型的上下文干净了。它不需要记“不要泄露用户手机号”“不要用弱类型”这些琐事。只需要专心处理业务逻辑。这个月跑下来,同一份需求下 AI 反复犯同类错误的比例降了六成以上。代价是产品经理要多花 20% 的精力去梳理哪些规范需要写进校验脚本、哪些可以做增量更新。但比起之前整天追着 AI 屁股后面改 prompt,我现在更愿意把时间花在设计工程护栏上。就是这样。

5. 收个尾:AI产品经理的终点不是模型能力,是可靠性工程

这一个月走下来,我最大的感受不是“AI变强了”,而是“我敢放手让AI干活了”。之前每次推线上,心里都悬着——它这次会不会忘了一条关键规范?上下文多了会不会乱?现在hooks把底层约束焊死,自动化校验在合并前拦一道,灰度分期慢慢放量。心态变了:从“祈祷它别出错”变成“出错也没关系,系统会兜住”。这种安全感不是来自模型本身,是来自我亲手搭的那套工程护栏。上周看到一篇报道说AI能让漏洞窗口缩小到小时级,我第一反应不是兴奋。更确定了一件事:如果漏洞窗口在缩小,那错误窗口也在缩小。系统越敏捷,越需要工程级的刚性约束来兜底,否则敏捷只会放大混乱。这是我现在的想法。

得物团队说他们的目标是消除开发过程中的不确定性。我认同这个方向,但“消除”这个词可能太绝对了。我更愿意说:把不确定性框在一个可接受的范围内。AI的不确定性是它的本性,上下文遗忘、概率输出、边界漂移,这些东西不会因为Prompt写得漂亮就消失。真正的解法是用工程的确定性去对抗AI的不确定性——把那些不能讨价还价的规则写进校验脚本,把需要持续迭代的业务逻辑留给模型去发挥。产品经理的角色也跟着变了。以前天天琢磨“怎么让模型记住更多东西”,现在琢磨“哪些东西根本不需要模型记,直接写成规则让系统执行”。前者是跟模型较劲,后者是跟系统协作。我这么看。

AI产品经理的终点不是模型能力,是可靠性工程。模型会迭代,能力会上限。但用户要的不是一个偶尔惊艳、经常翻车的产品,而是一个稳定可预期的工具。与其赌下一次模型更新能把失忆率降到零,不如现在就动手搭护栏。让AI在安全区内自由地发挥它的创造力,同时用工程兜住它一定会犯的那些错。这就是我做AI产品这两年学到的最实在的东西。

本文由 @Barry设集屋 原创发布于人人都是产品经理。未经作者许可,禁止转载

题图来自Unsplash,基于CC0协议