惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

Project Zero
Project Zero
D
Darknet – Hacking Tools, Hacker News & Cyber Security
Scott Helme
Scott Helme
Know Your Adversary
Know Your Adversary
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
WordPress大学
WordPress大学
AWS News Blog
AWS News Blog
小众软件
小众软件
www.infosecurity-magazine.com
www.infosecurity-magazine.com
Jina AI
Jina AI
AI
AI
美团技术团队
人人都是产品经理
人人都是产品经理
S
Secure Thoughts
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
V
Visual Studio Blog
宝玉的分享
宝玉的分享
Security Latest
Security Latest
P
Privacy & Cybersecurity Law Blog
C
Cisco Blogs
大猫的无限游戏
大猫的无限游戏
Google Online Security Blog
Google Online Security Blog
L
LINUX DO - 最新话题
罗磊的独立博客
Recent Announcements
Recent Announcements
H
Hacker News: Front Page
博客园 - 【当耐特】
K
Kaspersky official blog
cs.AI updates on arXiv.org
cs.AI updates on arXiv.org
SecWiki News
SecWiki News
Schneier on Security
Schneier on Security
cs.CV updates on arXiv.org
cs.CV updates on arXiv.org
Apple Machine Learning Research
Apple Machine Learning Research
F
Full Disclosure
Google DeepMind News
Google DeepMind News
V
V2EX
博客园 - 聂微东
量子位
云风的 BLOG
云风的 BLOG
C
Check Point Blog
J
Java Code Geeks
Exploit-DB.com RSS Feed
Exploit-DB.com RSS Feed
W
WeLiveSecurity
Engineering at Meta
Engineering at Meta
V2EX - 技术
V2EX - 技术
Vercel News
Vercel News
L
LINUX DO - 热门话题
T
The Exploit Database - CXSecurity.com
L
Lohrmann on Cybersecurity
The GitHub Blog
The GitHub Blog

人人都是产品经理

为什么你的产品找不到差异化?90%的失败都卡在第一步上(下) – 人人都是产品经理, 3年从30万到1300万用户、获2200万美元融资,这个AI教育产品用“抽卡”破解了获客难题 – 人人都是产品经理, 园区招商系统怎么做才能真正帮到去化?我加了这一个功能,推广链接转发400次阅读过万 – 人人都是产品经理, AI大事件:OpenAI发完网络安全模型又搞药物研发,小鹏汽车要抓”DeepSeek时刻” – 人人都是产品经理, 电商不是卖货,是一场更残酷的产品经理实战 – 人人都是产品经理, 没想到,活动营销又回来了! – 人人都是产品经理, 为何All-in海外KOC:一场关于AI时代窗口期的豪赌 – 人人都是产品经理, 重新理解企业的内部协作 – 人人都是产品经理, 苹果的 AI 战略到底是什么? – 人人都是产品经理, 医疗智能体·第2讲——合规护城河:等保、PIPL与HIPAA的架构实战 – 人人都是产品经理, 向量知识库五步法:从“答非所问”到“精准回复” – 人人都是产品经理, 鸿蒙PC三方库构建总指挥HPKBUILD(sha)库为例 – 人人都是产品经理, 何时该用LLM?AI产品经理的LLM设计指南 – 人人都是产品经理, 医疗信息领域的需求方、决策方、准入方以及关注点(二) – 人人都是产品经理, 即梦涨价:一场被误读的「傲慢」 – 人人都是产品经理, 面试AI PM必答题:Hermes和OpenClaw的区别,如何讲清楚业务价值 – 人人都是产品经理, AI的下一张船票:世界模型——AI产品经理必须理解的技术拐点 – 人人都是产品经理, 小红书做GEO,怎么让AI信你?记住这 3 个重要信息 – 人人都是产品经理, 5 家印度 AI 初创公司,看看印度 AI 再做什么 – 人人都是产品经理, AI项目跨团队协作:产品技术业务如何不打架 – 人人都是产品经理, Agentic Workflow(智能体工作流):让AI从”答案生成器”变成”数字员工” – 人人都是产品经理, lycium_plusplus 项目全景解读:OpenHarmony 三方库构建的“大管家” – 人人都是产品经理, 从爆单救火到前置履约:两套预采策略,把生鲜大促履约效率拉满 – 人人都是产品经理, 什么时候该补货?我用一轮数据做了一个决定 – 人人都是产品经理, 从“机械兜底”到“动态分流”:AI客服重复进线治理的4大底层逻辑 – 人人都是产品经理, 抖音拼效率,红书拼洞察 – 人人都是产品经理, 全民狂欢与退潮——为什么龙虾这波热潮冷却得如此之快? – 人人都是产品经理, Stripe押注!MPP重塑全球支付 – 人人都是产品经理, 小红书GEO:AI引用你的内容,不是因为你对,而是因为你看起来可信 – 人人都是产品经理, 前百度副总裁押注办公Agent,日韩付费爆发,Manus迎来强劲对手 – 人人都是产品经理, 企事业单位数字化的业务供需本质 – 人人都是产品经理, 医疗智能体·第1讲——医疗信息化重构:从“辅助软件”到“自主智能体”的范式转移 – 人人都是产品经理, 粉丝量就是空气!!! – 人人都是产品经理, 用户说“薯片碎了”,机器回“要买吗?”:意图识别的翻车与破局 – 人人都是产品经理, RAG召回准确率从75到90 我做对了这三件事 – 人人都是产品经理, AI大事件:Anthropic改收费、OpenAI发安全版、手术机器人纳入医保、阿里发布”秒悟” – 人人都是产品经理, Chrome 推出 Skills 新功能,Agent 重塑上网方式 – 人人都是产品经理, GitHub前创始人拿了a16z的1700万美元,做Agent时代的Git – 人人都是产品经理 拷贝或克隆其他 Flutter OH 项目到本地后无法运行 – 人人都是产品经理, 优惠券设计:优惠券创建 – 人人都是产品经理, 不用死磕文档!AI 助手 1 小时搞定飞书 CLI 安装 + 配置 + 知识库 – 人人都是产品经理, 用小龙虾做竞品分析报告:从2天到20分钟,我是怎么做到的 – 人人都是产品经理 用小龙虾做市场分析报告:搞懂这3个公式,市场规模不再靠猜 – 人人都是产品经理, 你早就在做 Harness 工程,只是不知道它叫这个名字 – 人人都是产品经理, Think Long就够?你可能想多了! – 人人都是产品经理, 货代SRM实战:供应商准入怎么做,才能让资源池不是通讯录而是可交付网络? – 人人都是产品经理, 如何做好用户调研?详解基本技巧 – 人人都是产品经理, 木鸟、途家、美团对打,平台春天行动开“卷” – 人人都是产品经理, 入职才发现公司不靠谱?小红书从业者求职避坑指南 – 人人都是产品经理, 美国 AI 三巨头联手封堵,中国 AI 突围之路在何方 – 人人都是产品经理, 小红书,放在需求对面的镜子 – 人人都是产品经理, AI 会带来大规模失业吗? – 人人都是产品经理, 从出单到补货前,我第一次犹豫:该不该放大? – 人人都是产品经理, Flutter 三方库鸿蒙化适配:5 种高效检查方式,快速判断是否需要适配 – 人人都是产品经理, 从做产品进阶拿结果:医美机构产品经理转岗科室运营经理 – 人人都是产品经理, 阿里HappyHorse,一场关于“Token经济”的阳谋 – 人人都是产品经理, To B AI:客户留存落地的观察与思考 – 人人都是产品经理, AI产品的“生命线”——数据采集、标注、清洗的产品化设计 – 人人都是产品经理, 谈谈AI Agent(二):当“孩子”能自己“体验世界”时,你该学什么? – 人人都是产品经理, UI/UX设计师的3层能力进阶,前两层让你活下来,第三层…才是真正的分水岭 – 人人都是产品经理, 2分钟 → 30秒,效率提升75%:B端产品经理如何用「规则枷锁」驯服AI幻觉? – 人人都是产品经理, 还没来得及学OpenClaw,来了个更猛的:Hermes Agent – 人人都是产品经理, AI日报:宇树机器人跑出10m/s刷新世界纪录 – 人人都是产品经理, 一文说透基金互金如何用情绪价值引导用户决策做转化 – 人人都是产品经理, 当浏览器开始替你”看”网页:AI 浏览器正在亲手拆掉它脚下的那张网 – 人人都是产品经理, 0代码,一天时间我Vibe Coding了个网站 – 人人都是产品经理, Hermes 和 OpenClaw 之争,Agent 的能力应该“装上去”还是“长出来”? – 人人都是产品经理 视频生成的“桌子”,字节Seedance 2掀完,阿里快乐马掀 – 人人都是产品经理, 从听不懂到完全信任:我的 Codex 深度产品体验 – 人人都是产品经理, 当虚拟偶像有了北京户口,与真人偶像还有什么区别? – 人人都是产品经理, 会说,远远比会做更重要 —— 对 SBTI 爆火现象的五层观察 – 人人都是产品经理, AI产品经理必看:当“搭环境”比“选模型”更重要,你的认知还在2024年吗? – 人人都是产品经理, 2026年AI产品商业化核心逻辑:从功能demo到规模化营收的3个必破卡点 – 人人都是产品经理, 京东围绕供应链,卷起裤腿下场的那些事儿 – 人人都是产品经理, SBTI一夜刷屏:它赢在了“太会说人话” – 人人都是产品经理, 折扣零售的真相:不是便宜,而是价值感! – 人人都是产品经理, 和甲方吵了一架,最后加钱做了——我学到的ToB产品经理生存法则 – 人人都是产品经理, 和几位小红书操盘手聊了8小时,干货全在这 – 人人都是产品经理, 智谱GLM-5.1登场,开源模型首超Opus4.6!!! – 人人都是产品经理 Anthropic收入凭什么反超OpenAI,终于有人把这事说清楚了 – 人人都是产品经理, 史上最有故事感的技术报告——Claude最强模型Mythos 7个极其精彩的细节 – 人人都是产品经理, 模型不是壁垒,Harness 也不是 – 人人都是产品经理, 抖音本地生活业务思考21 – 人人都是产品经理, Superpowers:145k Star的AI编码框架,到底是什么来头? Superpowers:145k Star的AI编码框架,到底是什么来头? – 人人都是产品经理, OpenAI 的路走错了,Anthropic Harness 解法启示:模型需要实践专科生 – 人人都是产品经理, 画原型图的前一步:设计站点地图 – 人人都是产品经理, 给 DeepSeek 的最后一封催更信 – 人人都是产品经理, 手把手教你用 Claude Code 搭建 AI 营销团队:5 个 Agent、12 项技能,独立完成研究、写作、设计全流程 – 人人都是产品经理, 你以为大模型在学语言?不,它在重新发明语言学 – 人人都是产品经理 所谓Skill,不过是AI时代的工业垃圾 – 人人都是产品经理, 聊一聊内容传播的几个方法 – 人人都是产品经理, 当平台开始吃掉生态:从 OpenClaw 被封杀,读懂 Anthropic 的这盘棋 – 人人都是产品经理, 你装了 10 个 AI 插件,Obsidian 还是一个文件夹 – 人人都是产品经理 关于AI智能体架构演进的系统性思考:从单体试水到多体协同的重构 – 人人都是产品经理, 当“人”变成Skill,我们又该何去何从? – 人人都是产品经理 Mythos 事件:前沿 AI 治理的意外实验 – 人人都是产品经理, 货代CRM:信用与风险管理怎么做,才能把坏账风险拦在放货之前? – 人人都是产品经理, 从HR收集自拍照到员工自助录入——我见证了园区人脸识别从”不可用”到”真好用”的全过程 – 人人都是产品经理 千问闯关AI混沌期:阿里画靶,吴嘉张弓,马云射箭? – 人人都是产品经理,
汤道生对话姚顺雨:腾讯对 AI 下半场最新思考
有新Newin · 2026-06-09 · via 人人都是产品经理

腾讯在AI产业应用大会上释放关键信号:当大模型进入实战阶段,Context与Co-Design正成为新护城河。混元大模型负责人姚顺雨与汤道生深度对谈,揭示腾讯如何通过智能体产品矩阵重构AI价值闭环——从WorkBuddy的效率革命到元宝的生态反哺,一场关于模型与产品共生进化的方法论正在成型。

6 月 5 日,在北京举行的腾讯 AI 产业应用大会上,腾讯集团高级执行副总裁、云与智慧产业事业群 CEO 汤道生与腾讯首席 AI 科学家、腾讯混元大语言模型及 AI Infra 负责人姚顺雨进行了一场近一个小时的公开对谈,全文超一万字。

作为腾讯今年最重要的 AI 发布平台之一,大会同步发布多项智能体产品与基础设施升级计划,也成为腾讯首次系统性对外阐述“AI 下半场”判断的重要场合

过去两年,大模型行业的焦点始终围绕参数规模、训练算力和榜单排名展开。但随着模型能力持续提升,行业关注点正在发生变化。对于腾讯而言,真正重要的问题已经不再只是模型是否更强,而是模型如何进入真实场景、获得真实反馈,并最终创造真实价值。Agent、搜索、办公协作、企业服务、开发工具等产品形态的出现,也让模型与产品之间的关系变得前所未有地紧密。

这场对谈中,双方没有过多讨论参数、架构和榜单成绩,而是把话题集中在更长期的问题上:当预训练和后训练逐渐成为成熟方法论之后,AI 行业下一阶段的核心竞争力是什么?为什么 Context 正在成为新的护城河?模型与产品如何通过 Co-Design 共同进化?Agent 为什么会成为下一代计算范式?以及一家大型科技公司应该如何同时建设基础模型、产品落地与前沿探索三种能力。

作为 ReAct 架构提出者,并曾参与 OpenAI Operator、Deep Research 等 Agent 产品研发的研究者,姚顺雨在加入腾讯后开始负责混元大模型建设。在他看来,AI 行业正在从“寻找方法”的时代进入“寻找问题”的时代。当大模型逐渐成为一种通用能力之后,真正稀缺的已经不是算法本身,而是场景、数据、上下文以及能够持续产生真实需求的产品生态。

以下为这场对话的主要内容:

汤道生:非常欢迎顺雨

姚顺雨:大家好。我平时都是在海淀区,很少来朝阳区,很高兴。

汤道生:今天我们两个对话,可能是一个比较新的形态,如果有什么出乎意料的,我想也是给大家一个惊喜。

顺雨,你加入腾讯前,我记得我当时问过你一些问题 ,为什么下半场会选择来腾讯?而且你认为AI下半场最重要的是什么?

姚顺雨 :首先解释一下什么叫做下半场,我最近感觉这个词有点被滥用,这个概念是我去年的一个博客提出来的,什么意思?其实我觉得在去年之前AI已经发展几十年,但是更加重要的是怎么去解决问题,去寻找好的方法,最近我觉得很明显就是说,方法论已经变得非常成熟,但寻找问题变得更加困难。

举个例子,比如说过去我们发明AIphaGo这样的方法去下围棋,但是这个方法只用来适合下围棋或者下各种棋类。你会为了翻译做一个特别的模型,但是它只能做翻译,不能做其他事情。

但是有了预训练和后训练之后我们发现,我们像有一个万能锤子,它可以砸任何钉子,它是一个通用方法论,可以解决各种各样的问题,反而更困难的是怎么寻找好的问题去解决。

其实我觉得加入腾讯很重要一点,就是说这里有很多好问题、有很多产品,我觉得这一点在接下来变得越来越重要。一方面,好的产品能够解决第一个问题:我们做预训练和后训练之后到底要把它应用在什么地方产生价值;第二个是环境是非常重要的,如果没有好的环境,那Agent没有办法做各种各样的事情,比如说如果没有一个点外卖的tool的话,就没有办法点外卖,很多事情做不到,我觉得最重要的是context,无论是企业还是个人,就像我上一次在AGI-Next说的一样,我觉得越来越重要的事情是context,因为模型越来越擅长把一个非常复杂的输入变成输出,很多时候你的竞争壁垒就在于你有没有最原始的输入,你知不知道这个人他到底在干什么,你知不知道这个企业各种各样的信息,这一点我觉得腾讯有非常强的优势。但其实我觉得这只是第二大的原因,最重要的原因是文化,我记得我第一次跟你聊天,包括和其他总办老板聊天的时候,我第一印象大家都非常诚实,哪里做的好哪里做的不好,非常直白不会掩盖,我觉得这种坦诚是我第一印象。

第二个就是说腾讯总体是一个基于trust,而不是基于metric去运转的公司,我觉得这一点对于做AI是非常重要的,包括我觉得我们的文化有非常low ego,有非常solid的这一面,我觉得这些文化对于长期做一个AI的组织是非常重要的,包括我们对长期主义的坚持,所以AI下半场最重要是什么?我个人觉得就是,我们应该在中国建立一个长期的基于AGI的组织,今天的AI主要有三部分:

首先是foundation的部分,我们怎么样把预训练和后训练最基础的东西做得非常solid。

第二部分是产品,我们怎么样把这样的技术,真的为人和社会产生价值。

第三个是frontier,我们怎么样探索新的研究范式,探索新的机会。

我觉得最重要的是我们构建一个非常均衡的三角形一样的组织。

我觉得对于做foundation来说:

第一最重要的是有充足资源。

第二就是需要正确的做事的方式,这些和我刚才说的文化也是吻合的。对于产品来说,有好的产品的sense,有这种做产品的人是至关重要的。

第三个,在中国我们今天所做的前沿探索不够多,所以我希望能把frontier exploration的精神能更多地注入到我们组织中。

汤道生:你提到的聊的过程中感受到的真诚或者务实的氛围,也是经常我跟客户交流得到的反馈,我觉得我们的做事方式,做产品的理念,其实也是比较实事求是的,毕竟AI赛道是长跑,我觉得有时候认知也很重要,我们做的好的和不好的也得认,但关键是一个多维度的竞赛,我们看到现在模型有很多进步,我们做产品其实也是有越来越多的形态,不同的场景有不同的需求,我觉得未来还是非常可期的。

你刚刚提到模型跟产品,产品可以说提供一个环境,里面要给模型提供context上下文,我想问一个问题,我们平时开会提的有一个词比较多是Co-Design,怎么把产品关模型能够比较紧密底结合起来,尤其今天有这么多丰富的产品,从我们合作非常紧密的像元宝这样的一个聊天机器人,包括AI搜索,企业里面也有部署智能客服、智能营销,另外最近非常火的类龙虾像CodeBuddy、Workbuddy这样的产品,其实对于模型依赖很深,你怎么思考Co-Design这个方式?

姚顺雨:有三点:

首先CoDesign的前提就是说模型本身要做的很solid,有很多foundational的work要做好。首先我觉得预训练是一个相对就是产品agnostic的事情,它做的非常solid可以提供非常强的foundation,而且预训练它最大的特点就是它是一个可泛化学习过程,它的进步可以带给各种各样下游任务持续的价值提升。后训练我觉得最重要一点是要设立好正确的Eval,中国大家有个不好的倾向是大家喜欢刷榜,但是我觉得更重要的是如何实事求是的基于产品,基于真正的应用,构造更加真实的Eval。

第二要意识到可能“实用性”价值是大于刷榜价值,这一点我们做大量工作,跟各种各样产品进行了深度Co-Design,Co-Design很关键一点就是要产生相互信任,这一点我们做了大量工作,取得互信,怎么把产品数据用好,怎么把回流,怎么把Eval做好,有很多细节,我就不赘述。

第三点我想说,LLM时代和过去的AI最本质的区别就是泛化性,在LLM之前比如说做翻译产品,只要把翻译数据做的特别好就行了。你做一个围棋的程序,你只需要把围棋的数据准备特别好就行。但是今天即使你想只做一个Coding Agent,你会发现其实需要的不仅是Coding Agent的数据,你需要非常好的聊天能力,非常强的搜索能力,非常强的指令遵循能力,非常强的推理能力,它其实是非常复合的data的taxonomy,我觉得需要对这个事情有一个taste。

这个事情的推论就是说有很多产品的体系化地方,会有比较大的优势,比如说我们和元宝的Co-Design使我们模型产生很强的聊天和搜索能力,这样的能力又可以被迁移到ima和Workbuddy其他的产品,所以这些产品能够提供不同的数据,但是这些数据之间又可以相互泛化,它形成一个像网络一样的体系,我觉得这一点的价值越来越重要。

汤道生:对,外部的榜也属于Eval的一种,所以我们内部做Eval跟外部的这种榜有什么区别?

姚顺雨:首先benchmark还是有它的价值的,不是完全没有价值,只是说这些榜非常容易 overfitting。基于真实世界的数据会对模型的研发有帮助:首先就是你能发现模型很多底线问题,实际上我们先发一个Preview模型最主要的目的之一是希望能够获得真实世界反馈,能修复各种各样榜单中没有发现的问题,这个在会在正式版上面有很大的改进。

第二点,你对真实的Prompt distribution会有一个更深的了解。我举个例子,比如说benchmark上面的这些题目可能它都是非常精确的,有非常长的concrete description,它可能一般来说是一个单纯的问题,但是我们知道在现实场景中可能大家问的问题都是比较模糊的,可能就一两句话,它会不停追问,这些场景可以启发我们怎么去更好做这样的训练。

第三点,我觉得甚至我们可以在这些产品上面获得一些灵感去推进现在还没有的榜单或者是没有领域的推进,比如说我们最近做了很多Context learning的工作,包括元宝的反馈也给我们很大的启发和帮助。所以我觉得产品和模型的互相成就是越来越重要的一个AI的话题。

汤道生:我记得我们早期做元宝的时候还碰到多轮遵循的问题,好像在使用产品,大家这种迭代Prompt的方式跟benchmark还有差异,真正在产品里面大家使用所需要的能力确实好像跟benchmark还有蛮大的差异的。

姚顺雨:其实我记得我第一次跟您聊的时候,你跟我讲了很多你过去的经历,从QQ空间、QQ秀的时代,一直到我小学时候最喜欢的产品。

到QQ音乐,到云到现在的元宝,其实跟你聊天很有意思,因为你做过各种各样的产品,to C也有,to B也有,远古时代的也有,最近AI时代的产品也有。我比较好奇,你觉得你做产品的第一性原理是什么,你觉得哪些经验和价值是不变的?哪些东西是变的?

汤道生:我觉得其实最终做产品还是本着用户到底有什么需求,我到底怎么去解决他的痛点,怎么去给用户或者客户创造价值。在不同的时代,甚至不同的行业,你做一个产品还是需要能够给用户带来价值,他才会买单,才会使用。所以我倒觉得从PC互联网时代我们做空间、移动的时代做各种各样的产品、内容的产品,到产业互联网做云,其实我们也要花好多的时间、精力去听客户的声音,尝试去帮助他们去解决他的问题。底层的逻辑其实没有这么大的变化。

但确实我觉得在PC互联网、移动互联网时代做产品跟今天在AI时代做产品还是有蛮多不一样的地方。首先从范式的角度来看,在AI时代以前我们做产品很多时候想的是通过功能来满足用户的需求,你作为一个产品提供方、服务提供方,你想清楚我提供怎么样的一个能力,让用户可能通过某些菜单去选,好像是一些“预制菜”,你只能在里面去点一样。

但在AI时代做产品,它的那种开放式的服务形态就会带来很不一样的要求跟挑战,用简单的交互方式可能是自然语言,可能是语音,其实作为产品方你也不知道用户会问什么。所以要充分利用模型能力去理解用户的需求,然后通过比如说今天大模型的这种逻辑推理,能去调用工具的能力,产品去给模型提供各种各样可以用的工具,来应对这种开放式的需求,这个是我觉得跟我们过去做产品很不一样的地方。

甚至也包括你刚刚提到的Eval,以前我们做产品有很清晰很具体的产品的细节功能的描述,怎么去做设计、做研发、做测试,我觉得那个瀑布式的流程也比较清晰。但是做AI产品,我发现最大的变化是我们整个流程可能都要重新设计,尤其今年大部分的代码都由AI生成,我们的工程师可能会花更多的时间去做设计,架构的设计,把写代码的工作都交给AI了,然后定期去指导一下、修正一下。然后测试也要左移,更前置去想清楚针对我们各种案例Eval、环境,我们对于开放式答案的要求,甚至alignment怎么对齐,我们用户所需要的那种风格,我感觉今天时代做产品其实要求的能力更全面。

姚顺雨:更难了。

汤道生:更难了。我问你一下混元3,大家都在说Hy3 preview是你腾讯的首秀,具体混元3做什么改变,你能给大家介绍一下吗?

姚顺雨:其实我觉得没有什么秘密,今天做大模型从某种程度来说比较Trivial的事情,我们应该把Infrastructure做好,我们应该把数据做好,算法的部分反而是比较简单的。其实我觉得主要几个点吧。

第一,我们把Infrastructure重建了,无论是预训练还是强化学习。第二是我们把数据和Eval做了很大的改变,如何去定义更真实的问题,如何丰富数据的 taxonomy,如何去提高数据的质量,这是一个永无止境的追求。

第三,我觉得很重要的很多决策其实包括怎么去招人,怎么去设立模型的节奏,怎么去每天有很多的Decision 要考虑很多Trade off,我觉得可能没有一个很清晰的公式,我觉得是一个很Taste driven的事情。所以我其实挺好奇问你一个问题的,因为您刚刚跟我讨论Co-Design这个概念,我很好奇您对Co-Design这件事情是怎么想的,你觉得哪些事情是应该模型做的,哪些是产品应该做的?

汤道生:我觉得Co-Design在不同阶段,过去这两年其实是一直在变化的,我觉得这个变化某种程度来讲是随着模型能力的升级而变化,当然整个行业、市场、用户的需求他在变化的过程中也会带来我们两边模型跟产品需要更好去满足。给我一个比较深的感受是怎么去对齐,因为在我们一起去做产品,去做对齐会的时候,我们有很多不同的决策,产品可能要针对某个方向去解决一些问题,模型到底怎么做去满足这个需求,但是你要回到模型需要数据,数据应该怎么标注,到什么颗粒度,到底什么是好的标注,什么是不好的标注,因为有一些地方要奖励,有一些地方要惩罚。

然后还有Eval,还有评测,因为如果产品认为好的产品体验,评测是不认同的话,大家其实做出来的产品就会不一致了。所以Co-Design给我的感觉更多是在项目组里面不同的角色参与到产品的设计,定了一些产品的目标方向,怎么让多个角色能够对于一些开放式问题有比较好的对齐,如果没有做到这样一个对齐的话,你会发现产品的行为会不可预测。甚至有时候会有一些随机性,因为模型训练的过程可能也被混淆了。所以这是我这两年跟做产品跟模型团队做Co-Design的一个比较深的感受。您觉得呢?

姚顺雨:其实我是觉得,就像我刚刚说的,首先最难的一点是要建立Trust,毕竟我觉得同理心很重要,因为说到底做模型的目标和做产品的目标有很多align的部分,也有很多不align的部分。就是模型人希望我能力越强越好,但是产品的人觉得用户需求越满足越好。所以天然有很多不align的部分,我觉得很重要的一点是要有换位思考的能力。

其实就是你刚刚问我元宝我们是怎么一步一步Co-Design的,其实一个很重要的细节是,我们当时是派了后训练最强的骨干力量,去帮助元宝把后训练做好。当时我们自己的预训练还没有准备好,但是我们知道维护元宝这样的产品以及它的DAU会对我们接下来做模型也非常非常重要,而且对于创新的合作非常重要。

所以当时其实很多算法同学不理解,我需要去很努力解释,但是现在看起来这些努力都是Trade off,我觉得这样一个动作让产品意识到模型的同学是真的在为产品着想,我觉得这个其实对于我们之后的合作,包括Hy3 preview在元宝上成功上线起到了非常重要的作用。当然有很多技术的部分可以探讨,但是最难的部分反而是怎么样建立信任,怎么样换位思考。

汤道生:对,非常认同。我换一个话题,你是ReAct架构的提出者,博士研究也是围绕着语言智能体展开的,你几年前的一些观点到今天兑现了吗?比如有哪些?

姚顺雨:那天我挺感慨的,我重新读了自己的博士论文,感觉又回到一个很远古时代,我的博士论文的title叫做language Agent from next token prediction to digital automation,是2019年。

汤道生:7年前。

姚顺雨:那个时候Literally就是我们的GPT2,那个时候它只能做Next token prediction,而且它产生一段话不太连续,或者有很多毛刺,所以当时人们很难想象到它有一天成为一个改变世界的力量,当时我觉得可能大家做的研究,稍微有想像力做一些研究,比如说中国首都是,如果做Next token prediction它会回答北京,somehow它是一个有Knowledge的事情,能做到这一点大家当时非常开心,觉得这个技术很有意思。

当时我的想象力比较狂野,我觉得GPT是一个非常优美的东西,吐下一个Token是一个非常极简且非常通用的事情,我觉得它有一天潜力不仅仅是在于吐出下一个Token,而在于把这个世界上所有的事情全部automate,我当时想的还不够大,我想的是digital automation,但是现在看起来也有可能是digital and physical automation。

我觉得其实我博士期间主要做两部分,第一部分就是如何建立一个Agent方法论,如何把一个Next Token prediction的机器变成一个Agent,变成一个自动化的机器,最重要的工作可能是你说的react。

我记得2022年7月份的时候某一天晚上,当我第一次把Pump two的API和当时手写的一个Wikipedia API连在一起,它第一次可以基于这个网页回答问题,并且多轮交互的时候,我当时感觉就像微弱电灯灯突然亮的感觉一样,我感觉据我所知,人类第一次把LLM和互联网连在一起并且做多轮交互,我当时的感觉是,这个感觉可能在5年或者10年会改变这个事情,但是可能比我想象中还要更快。

我记得当时我们第一次提出SWE-bench的时候,我觉得OK,如果这个事情能做到,那很显然它会带来巨大价值,当时可能是几百亿、上千亿,但现在可能是数万亿,数是万亿,可能我想的还是太小了。

另一部分我做的工作就是怎么定义Digital automation的任务,比如说WebShop是第一个基于互联网的Web Agent task,包括InterCode和SWE-bench是最早的Coding Agent这样的任务。现在看起来Agent技术最重要两个部分确实是外部Agent和Coding Agent。

那天我在群里跟大家聊天,我看我博士论文结尾,就是我在2024年写我的future work,第一个是train models for Agent,第二个是shift and robust deployment,第三个是scientific discovery,第四个是怎么样去help human,我很感慨,我说我现在很幸运确实在做当时列的future direction。

汤道生:太厉害了,都一一看到整个行业这些方向在推进。

姚顺雨:可能想的还是不够大,我觉得已经觉得自己想的够大了,但是可能还是不够大,我觉得。

汤道生:技术的发展往往超乎我们的预期。智能体今天大家都说需要消耗很多的Token,Token的调用,这对于混元做下一代模型研发,你觉得什么是你的侧重,有哪些地方比较重要?

姚顺雨:毫无疑问今天Agent或者Coding Agent有点像预训练一样,是不得不做的事情,是最基础能力。我个人觉得Coding Agent非常本质有很多原因。还有一个重要原因就是说它是一个优点像图灵完备的事情,当你有能力去控制自己的file system,当你有一个container的时候,其实你是一个complete这样一个system,今天我觉得Agent毫无疑问是每一家模型所发力的重点,我觉得我们做的方法可能会有几个区别:

第一,即使今天Coding已经是最重要的事情,但是我们还是会强调体系的全面化,我始终认为要把Coding做好,其实需要远远不止Coding的数据,也需要聊天、推理,各种各样不同的东西,因为大模型最重要的点是泛化性。

第二,很显然产品作用越来越重要,如何利用好线上回流,我觉得是一个每个模型厂商都在应对和思考的问题。这里刚刚积累很多CoDesign经验变得非常重要。

第三,我觉得还需要更多想像力,无论是技术演进,还是产品演进,甚至下一个范式演进,我们需要做探索性甚至不确定性的工作。

汤道生:从产品侧,因为大家越来越多有Token焦虑的声音,Token成本爆发式增长,我也听到很多客户甚至用户身边的同事们也在紧盯着积分消耗或者Token消耗,怎么可以让我们的模型在解决某个问题,或者完成某个任务,Token效率贵高,我之前做过一些任务可能是不同方向,有些方向也都知道肯定走不下去的,但可能模型还会试,试完之后走不下去再试下一个,里面有什么可以optimize的地方让Token整体使用效率更高?

姚顺雨:我觉得在中国讨论性价比更多讨论模型架构,但其实它是很复杂的体系,我觉得最重要的是首先是你的performance,很多人跟我说,他最后发现用OPUS这样的模型比用更差的模型更省钱,因为更快的把这个事情做对了,也省得人的精力,最重要的事情是performance,如果你的performance好,性价比是最关键的事情。尤其我觉得今年可能很多简单任务的robustness会变得更加重要,一次把相对简单任务做对,这可能是性价比更关键的部分,不仅是模型架构。

第二部分就是成本它本身,性价比第一是性能,如果性能不好性价比无从谈起。第二点是成本,中国是领先于世界的,就是我们做大量工作优化我们的成本,成本可能最重要的事情是怎么用一个更小的模型把更高的价值任务做好,在这基础上架构创新,包括长文管理,脚手架有很多需要做的事情。

如果我们做一个相对较小的模型,但是它比肩大模型性能,而且在大部分任务上做很强的robustness,这可能在很多长程的上面提升一两个点的提升,可能在今天的中国更有价值。我很好奇,您觉得Agent,你是什么时候意识到它是一个什么新的产品的机会,以及你现在认知是什么,你觉得现在我们离一个好用的Agent bottlenck在哪里呢?

汤道生:我们做的Agent,针对不同场景有不同的产品形态,在Agent设计上面,很大程度是发挥好模型能力,当然模型在迭代它能力越强Agent需要做的工作越来越少,我看我们好几个产品在过去这段时间是随着模型能力加强,我们可以把产品,把Agent做的更简化,更多的给模型提供更多不同的工具,创造更多的skills,来让模型能够更高效的去完成任务,给模型提供更多的我们叫记忆,用户过去使用一些习惯,我们能提取出来的一些用户preference的信息作为上下文,在Coding环境有相关的context给到模型,在Workbuddy里边办公协作,做个PPT,可能大家关注的内容或者该给到模型的context也会不一样。

所以在我们做不同的Agent,我觉得更重要是了解场景下什么内容,什么信息,是重要的,比较relevant的,能够跟模型配合好,让模型有它需要的信息,同时也发挥它的能力。

姚顺雨:最近我们确实推出一些像Workbuddy口碑不错的产品,背后很多小团队在快速迭代产品,我其实挺好奇,相对于传统的产品研发,你觉得在新的Agent时代的研发和组织管理上,产品团队发生什么变化,你的思考是什么?

汤道生:我前阵子在帮Workbuddy做一个组织发文,我看了一下他们那个非常扁平化的组织,跟我们过去的其他产品组织架构有很大差异,更多小团队三个人五个人,可能围绕某一个领域来做攻坚,而且有很多试验在里面,还要支持Infra做实验,让不同的小分队可以去探索然后再验证,因为试验大部分拿不到正向反馈,我们也要包容团队去试错,这种通过大量试验去提炼出对于用户流程,对于我们想要的这个结果有正向帮助,这个是我觉得今天做Agent,做原生AI产品,这个组织形态要能够比较好去支撑。

另外,原来可能有很多工程师有很多时间花写代码,但是今天毫无疑问他们这些工作可以交给AI了,所以我们会看到更多角色的融合,大家都是产品经理,都要去了解透彻用户需求,以及设计出我们想要的产品形态,每一个工程师更像一个有想法的leader,驱动多个Coding Agent,针对我们想要的产品需求去做研发、开发。同时要参与评测、测试,比较前置,也用好AI能力,把这些质量保证工作,对齐工作要做到前面来。

我也想再问一下一个可能大家比较多讨论的一个问题,很多人都会提到腾讯慢,说在AI上面我们没有及时抓住一些机会,你觉得我们真的慢了吗?到底下半场是什么?你能再多说一下吗?

姚顺雨:我觉得首先AI其实今天有两个重要判断,第一个就是说我们认为AI是一个短期的游戏还是长期游戏?在硅谷大家蔓延很多情绪,哎呀,e2年后所有人都要失业,AI要取代所有人的工作,我们要赶快赚2年钱退休。但很显然我们的判断AI是一个长期游戏,其实我觉得AI刚开始,下半场才刚刚开始,我不认为ChatGPT和CloudCode会是唯一的super App,我觉得那是一个非常灰暗的世界,我觉得肯定会有源源不断新的机会诞生。

可能今天就像是70年代PC刚刚产生的时候,我觉得还有很多很多事情需要做。

第二个判断,它会是个更线性还是多元游戏?因为确实过去几年大家能看到的是Pre-training、post training,然后Agent,Coding Agent,似乎有一个非常清晰的主线,这个主线是所有人都在做一样的事情,都在copy,这也是非常灰暗的事情。

但到底未来变得更单一还是更多元?我个人看法会变得更多元,毫无疑问Coding Agent生产力会变得更加重要,我觉得它是刚刚开始的事情,这个世界还有很多空间没有被填满,多模态、具身智能,很多很多新的事情都在发生,或者刚刚发生,所以从这个角度来说,如果我们认为下半场刚刚开始,可能确实不是完了。

过去模型、产品做了很多探索,走很多弯路,我觉得这是正常的,你如果没有做过一个事情,第一次做肯定有曲折,但是我觉得可能更重要的事情是能不能诚实面对自己,能不能Be Real,能不能够去看到feedback然后去改变,能不能够保持耐心,这个事情是下半场最重要的事情。

汤道生:大家对于腾讯经常喜欢挑某一个点来批评,当然我觉得我们也很欢迎大家给我们提更高的要求。

我们是一个非常多业态的公司,很多产品在很多的赛道,同时也有很多的团队在推进不同的项目、事情。所以毫无疑问,在这样一个复杂的组织里面有一些地方可能我们做得快了,有的地方做得慢了,有一些地方可能会做失败,在探索。所以我觉得这些提醒都非常好,我觉得确实有一些地方我们是可以做得更好,但是就像你说的,这是一个长跑,这是一个马拉松,腾讯还是有非常丰富的场景。

就你一开始提到选择腾讯,因为AI需要Context,模型需要很多的这些上下文,其实腾讯在过去多年不同产品,在不同赛道的这些积累,其实都是可以针对每一个场景去为模型提供有用的信息,提供这些Context来发挥价值。

在这样一个长跑,我相信模型会不断迭代,用户的需求也在不断变化,也会有新的产品形态出现,我觉得我们比如说今年年初对AI这一波热潮也反应比较快。同时也有像WorkBuddy这样的智能体产品,其实也是几年前开始做的产品,沿着原来做Coding、CodeBuddy,慢慢看到非程序员也有很强的需求,我们也能比较快去应对,今天也听到很多客户对于我们的不同产品怎么去组合起来有非常高的期待。

所以我们正在长跑中,也请各位多给我们提醒,给我们建议,也多用我们的产品来给我们正向的反馈。

我看时间其实都超时了,我想我来首先感谢顺雨今天的分享,我们刚才其实围绕了做模型、做产品,谈到了Co-Design,谈到了Agent的演进,也提到了组织变革,行业的一些机会,在过去一年其实我们看到非常多企业也有共同的困惑或者面临同样的挑战。产品如果用不好,企业不能持续去投入,或者ROI不够,这都会影响AI在企业里面普及的进度。为此,其实我们今天也会发布一套效率智能体的工具集,帮助企业可以更安全、更高效去部署应用的智能体。

这背后有腾讯的三个核心能力:

第一是场景联接的能力,通过腾讯的微信、企业微信、元宝等等高频的场景触点,来把大模型嵌到真实的业务流,跟用户、数据、生态能够深度联接。

第二是工程的驾驭能力,通过完整的Harness体系,让Agent能够稳定、可信、可持续运行,具备强大的AI Infra,让包括高速的网络、高吞吐的存储,还有高性能的Agent Runtime来保证GPU的高利用率。

第三是模型驱动力,依托混元大模型和模型产品 Co-Design ,兼顾实用性、性价比和 ROI。

本文由人人都是产品经理作者【江天 Tim】,微信公众号:【有新Newin】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。

题图来自作者提供