惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

H
Help Net Security
T
ThreatConnect
SecWiki News
SecWiki News
F
Future of Privacy Forum
AWS News Blog
AWS News Blog
C
Cisco Blogs
A
Arctic Wolf
Vercel News
Vercel News
The GitHub Blog
The GitHub Blog
Scott Helme
Scott Helme
V
V2EX
博客园 - 叶小钗
阮一峰的网络日志
阮一峰的网络日志
K
Kaspersky official blog
G
Google Developers Blog
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
P
Privacy International News Feed
C
Cyber Attacks, Cyber Crime and Cyber Security
N
News | PayPal Newsroom
Schneier on Security
Schneier on Security
NISL@THU
NISL@THU
Microsoft Azure Blog
Microsoft Azure Blog
量子位
The Hacker News
The Hacker News
Stack Overflow Blog
Stack Overflow Blog
Security Latest
Security Latest
M
Microsoft Research Blog - Microsoft Research
Google Online Security Blog
Google Online Security Blog
博客园_首页
C
CXSECURITY Database RSS Feed - CXSecurity.com
I
InfoQ
Google DeepMind News
Google DeepMind News
Y
Y Combinator Blog
The Cloudflare Blog
Microsoft Security Blog
Microsoft Security Blog
Martin Fowler
Martin Fowler
Cisco Talos Blog
Cisco Talos Blog
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
T
Troy Hunt's Blog
F
Fox-IT International blog
S
Security @ Cisco Blogs
博客园 - 司徒正美
cs.CV updates on arXiv.org
cs.CV updates on arXiv.org
C
Comments on: Blog
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
L
LINUX DO - 最新话题
GbyAI
GbyAI
Project Zero
Project Zero
腾讯CDC
T
Tailwind CSS Blog

人人都是产品经理

黄仁勋最新2万字演讲全文,GTC2026演讲完整实录 – 人人都是产品经理, 最强安全模型 Mythos 来了:别听自媒体吹牛,这只是 B 端自动化的补票工具 – 人人都是产品经理, 从规模到质量,木鸟途家美团转向情绪消费 – 人人都是产品经理, 财务AI最先赚钱,但99%的人都搞错了方向 – 人人都是产品经理, 转岗 AI 产品经理,赢在第一步:先搞懂自己适合哪一类 – 人人都是产品经理, AI把PRD、原型、竞品分析全干了,那我干啥? – 人人都是产品经理, 重磅开源!Harmonybrew 正式上线:把成熟 Homebrew 生态带入 OpenHarmony – 人人都是产品经理, 最近几个月的AI大模型独立应用实践-3-大模型解决不了一切 – 人人都是产品经理, AI给我干哪来了 – 人人都是产品经理 AI时代,大厂重回PC战场 – 人人都是产品经理, 降价只是第一步,DeepSeek 真正要做的事比你想象的大得多 – 人人都是产品经理, 用户分群分析:为什么同一个活动,不同用户反应完全不同? – 人人都是产品经理, 拼多多新链接如何快速入池 – 人人都是产品经理, 【财务】自动匹配银行回单,减少出纳人工操作 – 人人都是产品经理, 企业AI Agent落地第一课:先分清“老会计”和“管培生”的活 – 人人都是产品经理, AI 产品经理手记:一份能跟模型团队 battle 的评测框架(上) – 人人都是产品经理 大模型交互的底层原理:给模型造一个临时执行环境 – 人人都是产品经理, 酒店配送机器人・软性动态场景全流程思辨复盘 – 人人都是产品经理, 工业数字化与行业软件产品,如何从客户愿意购买的商品,变成公司能持续经营的业务? – 人人都是产品经理, 小红书郑州帮打法进化成什么样了? – 人人都是产品经理, 第一个游戏项目,别急着把 AI 塞进工作流 – 人人都是产品经理, AI时代,产品经理如何设计更懂用户的大屏可视化产品 – 人人都是产品经理, 寻找Token之上的硬资产:2026年AI应用层的去泡沫与范式转移 – 人人都是产品经理, 会计引擎原理及流程 从传统 PM 到AI PM,我们如何用一套框架复盘自己的项目(四步法),让面试官能认可和点头 – 人人都是产品经理, HarmonyOS 6.0/6.1 核心新特性:空间、智能、全场景全面革新 – 人人都是产品经理, 最近几个月的AI大模型独立应用实践-2-岗位已经模糊 – 人人都是产品经理, 最近几个月的AI大模型独立应用实践-2-岗位已经模糊 – 人人都是产品经理, 从0到量产:汽车IPD全流程落地实战案例(内含阶段详解) – 人人都是产品经理, AI评测如何避坑?从信息聚合到独立标准的产品逻辑 – 人人都是产品经理, AI互联网日报:DeepSeek调用量登顶/小米新机或新增AI键/Google伙伴Xreal继续押注智能眼镜 – 人人都是产品经理, 小红书博主管理与深度链接 – 人人都是产品经理, 企业经营分析・财务指标全景地图 – 人人都是产品经理, AI用户体验要素三:“Agent to UI”设计组件新范式 – 人人都是产品经理, DTC 衰落,网红品牌大衰退 – 人人都是产品经理, AI生产力:从效率到工作流重构 – 人人都是产品经理, LinkedIn废掉APM那天,我撕掉了团队的产品经理招聘JD – 人人都是产品经理, AI 正在从功能插件变成行动单元,AI PM你准备好重建“系统感”了吗? – 人人都是产品经理, 你认为很low的蜜雪冰城,才是做品牌的风向标。 – 人人都是产品经理, 没有人推拉勾一下,它只是自己倒下了 – 人人都是产品经理, OpenAI急着上市,但ChatGPT不是它的王牌,Codex才是 – 人人都是产品经理, 产品经理如何进行需求优先级排序? – 人人都是产品经理, Gemini 3.5:谷歌的 Agentic 时代宣言,我们该怎么接? – 人人都是产品经理, AI 抢走了”有”,抢不走”无” – 人人都是产品经理, 系统 Prompt 写了 3000 字,用户只问了你好 – 人人都是产品经理, 「传统企业数字化升级」系列第三篇——传统服务型企业如何互联网升级 – 人人都是产品经理 HappyOyster、Genie 3、混元 HY-World 的产品逻辑与战略博弈 – 人人都是产品经理, 【运营思考】人与人之间最大的区别,就是思想的不同 – 人人都是产品经理, 不会写代码的我,是怎么一个人跑通五个产品的 – 人人都是产品经理, Prompt 工程在 Agent 里怎么跑 – 人人都是产品经理 从0开始vibe coding,产品上线一个月1500+用户,我的一些思考 – 人人都是产品经理, 为了给我的AI团队造间”办公室”,我开发了这套本地多Agent协作系统 – 人人都是产品经理, 中小品牌开拓新渠道的正确姿势! – 人人都是产品经理, 半年前我就在做Harness Engineering – 人人都是产品经理, 拉勾破产:一段互联网创业简史 – 人人都是产品经理, 从一次面试的“卡壳”,看全球化浪潮下tob市场人的能力重构 – 人人都是产品经理, AI执行规范只有70%?剩下的30%靠系统“护栏”兜底,一个AI产品经理的可靠性设计笔记 – 人人都是产品经理, 中企赴波兰展业:财税数字化蓝图 – 人人都是产品经理, AI互联网日报:Anthropic盈利和OpenAI上市,AI行业要变天了/今日头条对头条百科业务进行裁员调整 – 人人都是产品经理, 2026重塑产品-周期篇:它是静止的还是动态的? – 人人都是产品经理, 当90%的工程师用AI写代码,AI 组织的管理者要怎么办? – 人人都是产品经理, 货代单证模板实战:如何把「排版权」还给业务,又不丢掉数据准确性? – 人人都是产品经理, AI 时代,构建本地AI知识库 – 人人都是产品经理, 面试、述职、汇报时,总有人问:“你的分析结论,怎么落地闭环?”三种模式,轻松回答! – 人人都是产品经理, 一张图讲透:预算治理架构 – 人人都是产品经理, 我们是行业里最早拥抱AIGC的一批,三年后却越来越差 – 人人都是产品经理, AI 应用搭建平台的知识库竞品分析:RAG 功能为什么会这样设计? ——以百度千帆与 Lyzr AI 为例 – 人人都是产品经理, 中国Agent产业面临的四重不确定性挑战——《重构与崛起——OpenClaw时代的中国Agent产业生态报告》解读六 – 人人都是产品经理, 单枪匹马年入百万美金:拆透海外顶流创客 Dan Koe 的产品逻辑与超级个体法则 – 人人都是产品经理, 产品经理的AI护城河:不是写Prompt,是接住那颗从未变过的人 – 人人都是产品经理, AI时代,产品经理的AI落地指南! – 人人都是产品经理, AI互联网日报:Spotify把AI翻唱推向版权灰区/Google AI眼镜接近可用/京东或20亿英镑竞购英国电商 – 人人都是产品经理, 一文看懂VLA:自动驾驶的下一个范式 – 人人都是产品经理, 终于,微信公众号也不让你留个人微信号了 – 人人都是产品经理, 中国Agent产业发展趋势——《重构与崛起——OpenClaw时代的中国Agent产业生态报告》解读五 – 人人都是产品经理, AI还原页面设计怎么做?我实测后总结了这套「块状精修法」! – 人人都是产品经理, AI用户体验要素二:那些无法忽略的UI交互行为 – 人人都是产品经理, 货代员工管理实战:如何把考勤、加班和人力成本做成可控的经营数据? – 人人都是产品经理, 月薪5万也招不到?AI产品经理的真实薪资与隐形门槛 – 人人都是产品经理, 大多数AI产品,其实是在给自己人做的 – 人人都是产品经理, 运营人必懂的3步数据分析逻辑,一线业务应用指南 – 人人都是产品经理, 我的AI写稿全流程公开 – 人人都是产品经理, 从 Gemini 实时多模态狂欢降温:B 端产品经理该怎么看这场 Omni 进化 – 人人都是产品经理, AI搜索没有杀死广告。它只是把广告藏进了你信任的那句话里 – 人人都是产品经理, 跨境税务系统:边界、能力与风险前置06 如何创建一家AI Native公司?Anthropic刚发的这份手册,把答案说清楚了 – 人人都是产品经理, 跨境账务系统:在不确定中形成可解释结果05 – 人人都是产品经理, Electron-OH 37.2.1 正式发布:鸿蒙PC开发体验全面升级,跨端开发再提速 – 人人都是产品经理, Notion CEO重新定义了一件事:什么样的人在AI时代真正值钱 – 人人都是产品经理, Notion CEO重新定义了一件事:什么样的人在AI时代真正值钱 – 人人都是产品经理, AI搜索的广告比你想象中更危险:它连你的怀疑都省了 – 人人都是产品经理, 做了一年客服型外呼 Agent,我发现旧的效果评估体系正在失效 – 人人都是产品经理 我以为用户好评是成功,直到我发现它背后藏着一个致命的陷阱… – 人人都是产品经理, 谷歌 I/O 炸场看完了:别再用百万级的自嗨对话框去增加企业的翻译税 – 人人都是产品经理, AI写代码的速率是人的10倍,端到端却只快了2倍:产品经理视角下,没人讲清楚的3件事 – 人人都是产品经理, 提示词的本质:不是“咒语”,而是 AI 产品设计中的需求表达能力 – 人人都是产品经理, 和代运营合作5年后,我真的不建议大健康私域再找代运营了! – 人人都是产品经理, 场景不同,测评方法需要因地制宜:最新摸索的测评“四象限法则”分享 – 人人都是产品经理, 为什么很多人抄爆款,越抄越不像? – 人人都是产品经理, 妙鸭AI生图团队解散:从”时代宠儿”到”被遗忘者”的启示 – 人人都是产品经理
模型会出错,可流程不许出错——零容忍场景里,AI 产品经理到底在管什么 – 人人都是产品经理,
Talen · 2026-05-26 · via 人人都是产品经理

当AI模型准确率高达90%时,工业场景真正在意的却是那10%的错误如何兜底。本文深度剖析高风险AI项目中产品经理的核心战场——不是追求模型完美,而是构建严密的防错体系。从预警工单的三重质检机制到冷启动数据的巧妙挖掘,揭示如何在不许出错的领域让不确定的AI输出确定的结果。

前阵子有个做工业软件的朋友跟我喝酒,吐槽他们刚上的那套排放异常预警。模型准确率做到九成,老板在周会上还挺得意。结果环保局的人来调研,听完介绍只回了一句:剩下那一成错的时候,谁去顶?

他当场没接上话。

这一句,差不多就是所有高风险 AI 项目的命门。工业环保监测尤其是这样——一个排放数据判错了,后面牵的不是什么用户体验,是停产、是罚单、是真有人要担责任。在这种地方,你跟人说”准确率九成”,对方压根不关心那九成,只关心那错的一成兜不兜得住。

而兜底这件事,模型自己干不了。能干的只有产品经理。

我做产品 4 年,最近 2 年都泡在 AI 方向,越做越觉得:在不许出错的场景里,PM 真正该操心的根本不是模型准不准——那是工程师的战场——而是模型错的那一下,整套流程接不接得住。模型天生是不确定的,可你交到客户手上的东西必须是确定的。这两者中间隔着的那层,才是 PM 的活。

下面几条,是我自己琢磨过、也跟几个做工业的同行掰扯过的。不一定对,挑几个想得比较清楚的说。

先得认一件事:不是所有输出都值得你较劲

我见过太多 AI 项目,一上来就想给每个输出都上保险,结果系统又慢又贵,最后谁也推不动。

毛病出在没分清轻重。

内部知识问答答错了,用户再问一遍就完事,几乎零成本。可排放超标的处置建议里,模型把”先断电”那一步给漏了,工人照着干,那是会出人命的。这两种错,凭什么用一套标准量?

所以第一件事不是建模型,是坐下来跟业务一条一条过:这个输出错了会怎样?最坏到哪一步?最后拍板的是人,还是机器?

(我发现不少 AI 产品经理特别躲这种活,总觉得这是业务该操心的,自己应该去钻 prompt、钻检索。可偏偏就是这步躲掉了,后面所有防护都盖在空中。)

过完一遍,心里大概就有杆秤了。有的输出直接触发设备动作、派工单、决定放行还是拦——这种错一次代价就够大,得重防。有的是给个参考、人还会再确认一遍的——轻轻拦一下就够。有的纯粹是给人看的日报摘要——人自己会把关,你瞎防反而添堵。

劲要使在刀刃上,不是摊在每一寸。

质检不是判个对错,是分几道关、各管各的

就拿预警接抢修工单这条线说。从一个异常被发现,到一张工单递到工人手上,中间得过好几道关,每道关盯的还不是一回事。

最前面那道,机器几毫秒就跑完,便宜得很。它不管对不对,只管能不能用:字段填全没有,设备编号格式对不对,工单上写的备件编号在仓库系统里查不查得到,优先级是不是只填了那几个允许的值。这道关拦的,是模型在信息不够时自己瞎补进去的东西——最低级,也最高频。

再往后一道,得上模型了,盯的是对不对。归因说的是 3 号机组主轴承坏了,抢修步骤里却写着换 2 号机组的轴承——设备号都对不上。这种矛盾,规则不一定抓得全,得让另一个模型把整张单子从头读一遍。合规文件白纸黑字写着必须先断电,可生成的步骤里压根没断电这一步,这也得靠语义去比对。

最后一道,是人。涉及人身安全的、动火吊装这类特种作业的、核心产线停机的——必须有个活人签字。这道关最贵,所以只能留给最该留的那几张单。

三道关不是重复劳动。代码看不懂逻辑矛盾,模型读不出”这条规程是法律强制的”,人又不可能去一张张盯成千上万条格式错。少哪道,都会从那个口子往外漏东西。

PM 要干的,就是把这几道关怎么排、什么单子走哪条道,画成一张谁都看得懂的图。

还有个细节特别容易漏。

质检那道关吐出来的,别只是一个红叉。我见过一个团队就栽在这儿。他们的质检只返回”通过/不通过”,结果每次不通过,都得有个人去翻到底哪儿错了。检查是上了,人比以前还累。

那不叫防错,那叫给自己又添了个瓶颈。

正经做法是让它吐一份明细:哪个字段有问题、问题是什么、跟哪条规程顶了、模型自己有几分把握。这份东西能再喂回去,让系统自己改一遍、重新过关,人只管那些机器修不动的疑难杂症就行。

有几件事,PM 最好别伸手

说完该干的,得说说不该碰的。这部分我觉得比前面还重要,因为 AI 产品经理最容易在这儿栽跟头——刚看完两篇技术文章,就觉得自己什么都懂了。

最常见的就是微调。一聊到模型不够准,总有人脱口而出:”要不咱微调一个?”

在用检索的场景里,多数时候真不用微调,PM 更不该是拍这个板的人。

微调是把知识烧进模型的权重里。可你做检索,知识是用的时候现查、现塞进去的,根本不用烧。报告生成也好、异常归因也好,要的是把查来的文档读懂、按模板写出来——知识库做扎实、prompt 写清楚,就够了。真到了输出格式刁钻到 prompt 怎么写都跑偏、或者专业术语模型根本不认、检索也喂不进去那一步,才轮得到微调。可到没到那步、怎么调、拿多少数据调,那是工程师的判断,不是 PM 该硬插的手。

我那个做了十几年工业自动化的朋友有句话,我一直记着:产品经理最危险的一刻,就是他觉得自己听懂了的那一刻。

还有个地方 PM 老搞混——预警这一步到底用什么。

一提预警,好多人张口就是”用大模型行不行””千问能不能上”。这是把两码事混一块儿了。

预警处理的是传感器吐出来的一串数字:温度、压力、流量、浓度。判断这堆数字里有没有不对劲,用的是异常检测、分类那一类模型,根本不是语言模型该管的事。冷启动时没标注数据,先上无监督的,让它自己摸清楚正常长什么样,偏了就报警;等攒够了标注,再换成能分清异常类型、还能给个概率的有监督模型。

大模型在哪儿出场?在后面——拿着查来的历史案例和故障手册,去把原因讲出来、把抢修步骤写出来、把工单组织成型。前半段是发现数字不对,后半段才是用人话把事说清楚。两段用的压根是两种东西。

PM 不用会调这些模型,但得分得清这条道上每一步该用哪一类。分不清,需求文档里就会蹦出”用大模型做预警”这种让工程师哭笑不得的话。

那工单到底要不要每张都人审?

不一定。看两件事:风险高不高,系统跑稳没。

风险这条,有一段是技术绕不过去的。特种设备、危化品、动火作业,国内这些领域人工审核是法规写死的,不是你产品设计上能选的。这条线,拿任何技术理由都跨不过去。PM 能做的是认下它、老老实实把它画进流程,而不是琢磨怎么绕。

系统成熟这条,倒是能慢慢挪。新系统刚上,让所有单子都过人——不是不信任模型,是这会儿每一张被人改过的单子,都是质检模型最好的教材。等某一类单子的质检准头稳了,再把这一类放开自动派。人工就这么一点点退到只剩高风险那几类。

所以”要不要人审”不是一锤子买卖,是一条会动的线。PM 的活,是设计这条线怎么挪、按什么指标挪、挪的时候留什么兜底。

兜底这点,在抢修里尤其要命。抢修是抢时间的,质检要是把流程卡死、单子半天出不来,那就是帮倒忙。所以质检没过的时候,不能让单子堵在那儿,得留一条快速转人工的道——宁可叫人来接,也不能让流程停摆。

防错和效率,在这种地方天生是打架的。怎么取舍没有标准答案,得看那台设备坏了到底有多急。

置信度这个词,别被它唬住

聊质检绕不开置信度,可这词一出来好多人就懵。其实特别白。

你就想象一个老师傅站在设备边上盯着,心里默默打分。一切正常,十分,放心;有点不对味儿,六分,接着盯;八九不离十要出事了,九分,赶紧喊人。置信度,就是让模型学这个老师傅打分,给个零到一之间的数。

不同模型算法不一样,这个不重要。重要的是工程上有条铁律:单看某一个时刻的分高,没用。

噪声、抖一下,都可能让某一瞬间的分蹿上去。真该报警的,是一段时间里这个分稳稳往上爬——这一刻 0.6,下一刻 0.7,再下一刻 0.8,连着几下都压在高位。偶尔跳一下就报,工人很快会被假警报磨得麻木,等真出事那回反倒没人搭理。

漏报会出事故,误报会让人不再信这套系统。两头怎么平衡,得看设备多金贵:核心的宁可错报也不能漏,边角的就得把误报压住、别天天扰民。

阈值定在哪,说到底不是技术题,是业务题。把业务的轻重缓急,翻译成模型里那个阈值——这恰恰是 PM 该干的。

冷启动没那么吓人,数据可能就压在你手边

工业 AI 最常卡在这儿:一开始没有标注数据。不少团队就堵这儿了,觉得没数据没法训,迟迟动不了。

可数据往往就在手边,只是没被当成数据看。

维修工单就是。每张工单都写着:啥时候、哪台设备、出了啥故障。这等于天然标好了”异常发生在什么时间、是哪一类”。拿故障时间往前推几个钟头,那段传感器数据就是异常样本;挑设备稳稳运行、啥记录都没有的时段,就是正常样本。冷启动要的数据,这么一拼就出来了。

不过有个坑得提一句:过去没报警,不等于过去没异常,可能就是当时没人发现。所以从老数据里挖出来的”正常样本”别全信,最好拉个老工程师再过一眼。标注这道关,机器替不了人。

行业里有个挺聪明的做法:先用不要标注的无监督模型把摊子支起来,它报一次警,就派人去现场看一次,看完的结论又变成新的标注,攒够了再升级成更准的模型。系统就这么边干活、边给自己攒教材,越跑越准。

PM 在这事上能出的力,是去翻清楚公司手里到底压着哪些”看着不像数据、其实是数据”的东西。工单、停机记录、巡检台账——这些往往比你重新去采一批,值钱多了。

最后

写到这儿回头看,有个结论其实挺反直觉:在不许出错的场景里,PM 花在模型本身上的劲,反而该是最少的。

模型准不准,那是工程师的战场。PM 真正要守的,是模型外面那一圈——哪些输出值得防,防到什么份上,谁来兜底,那条人工的线怎么随系统成熟一点点往外挪,还有哪些事自己压根不该碰。这些想透了,比把准确率多抠两个点,对落地的意义大得多。

这套东西,没有哪一条是能从论文里直接抄来的。它一半在车间,一半在规程,还有一半,在那个出了事要担责的人身上。

所以我也不敢说上面这些就一定对。我就是把自己想过、跟人吵过的几条摆出来。

留个问题给你:你手上那个 AI 项目,要是模型明天就错一次,谁会第一个知道?知道之后,是系统自己把它接住了,还是得等个人加班来救火?这俩要是答不上来——可能就真不是模型不够好的问题了。

本文由 @Talen 原创发布于人人都是产品经理。未经作者许可,禁止转载

题图来自Unsplash,基于CC0协议