惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

H
Help Net Security
The GitHub Blog
The GitHub Blog
F
Fortinet All Blogs
cs.CV updates on arXiv.org
cs.CV updates on arXiv.org
Simon Willison's Weblog
Simon Willison's Weblog
D
Darknet – Hacking Tools, Hacker News & Cyber Security
Cisco Talos Blog
Cisco Talos Blog
P
Privacy & Cybersecurity Law Blog
I
Intezer
Y
Y Combinator Blog
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
CTFtime.org: upcoming CTF events
CTFtime.org: upcoming CTF events
N
Netflix TechBlog - Medium
The Hacker News
The Hacker News
AWS News Blog
AWS News Blog
aimingoo的专栏
aimingoo的专栏
A
About on SuperTechFans
Exploit-DB.com RSS Feed
Exploit-DB.com RSS Feed
Stack Overflow Blog
Stack Overflow Blog
Hacker News: Ask HN
Hacker News: Ask HN
酷 壳 – CoolShell
酷 壳 – CoolShell
量子位
K
KPMG report finds enterprise disconnect between AI and its ROI | CIO
B
Blog
T
Tor Project blog
C
Cybersecurity and Infrastructure Security Agency CISA
云风的 BLOG
云风的 BLOG
博客园_首页
V2EX - 技术
V2EX - 技术
T
Threat Research - Cisco Blogs
腾讯CDC
宝玉的分享
宝玉的分享
博客园 - 叶小钗
罗磊的独立博客
S
Securelist
The Last Watchdog
The Last Watchdog
Google Online Security Blog
Google Online Security Blog
Scott Helme
Scott Helme
博客园 - 司徒正美
W
WeLiveSecurity
有赞技术团队
有赞技术团队
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
S
Secure Thoughts
NISL@THU
NISL@THU
N
News and Events Feed by Topic
Cyber Security Advisories - MS-ISAC
Cyber Security Advisories - MS-ISAC
雷峰网
雷峰网
大猫的无限游戏
大猫的无限游戏
K
Kaspersky official blog
IT之家
IT之家

钛媒体:引领未来商业与生活新知

英特尔发布至强6+,芯片算力在“时间压缩”与“几何微缩”的交汇处-钛媒体官方网站 快撑不住的千亿粤派房企,开始抛售自家酒店了-钛媒体官方网站 公狗剧场≈性转版“崩老头+浪姐”÷2-钛媒体官方网站 宇树上会,机器人会成为半导体下一个超级终端吗?-钛媒体官方网站 玩家深恶痛绝的“广告”,却被厂商卖到了畅销榜TOP4-钛媒体官方网站 一个月内三破世界纪录,光伏龙头全面开启BC竞速赛-钛媒体官方网站 玻璃基板产业化进展到哪了?-钛媒体官方网站 为什么文案策划常被误解?-钛媒体官方网站 GPU抢了风头,西部数据说存储才是AI规模化的真正门槛-钛媒体官方网站 看懂十年两轮锂周期,就学会了投资这个赛道的一半-钛媒体官方网站 神药退潮,超4000亿美元肿瘤新战场谁能称王? 好品牌,开始竞争“互动率”-钛媒体官方网站 孙正义带领软银投资法国核电, 与施耐德这场合作能否突破欧洲算力的困局? 卷向流量的景区们,都在扎堆造“明星”-钛媒体官方网站 ASCO观察:全球首个+1“得福组合”重新定义大单品-钛媒体官方网站 从万播5元到7天充电15万+,AI漫剧开始重做“用户生意”?-钛媒体官方网站 营销失灵,电影们开始“碰运气”了-钛媒体官方网站 Edge AI Daily 早报(6月1日)-钛媒体官方网站 中国商业航天追赶的,从来不只是SpaceX-钛媒体官方网站 Anthropic 冲击 1 万亿:除了 Pre-IPO,还有哪些隐藏的「Claude 概念股」?-钛媒体官方网站 【钛晨报】提升全民人工智能素养,四部门最新部署;MiniMax Group Inc.:拟于科创板上市;国家统计局:5月份制造业采购经理指数(PMI)为50.0%-钛媒体官方网站 赢家亏本转让,输家如愿接盘?山高环能的蹊跷“便宜”不好捡-钛媒体官方网站 阿里"上货",字节"练功"-钛媒体官方网站 260亿美元,“全华班”撑起全球AI编程估值最高公司-钛媒体官方网站 加入“清华圈”,黄仁勋放不下中国-钛媒体官方网站 东方甄选布仓、辛巴开超市:中小玩家分层应战-钛媒体官方网站 “爸爸品牌”,正在集体自救-钛媒体官方网站 618暗战已开,除了低价,大家还在“卷”什么-钛媒体官方网站 监管加码补贴收紧,外卖大战落幕,但消费入口争夺战才刚刚开始-钛媒体官方网站 140万亿Token之后:中国正在修建“算力高铁”-钛媒体官方网站 暴增3100亿!存储巨头大普微,估值泡沫已现-钛媒体官方网站 一季度亏掉23亿,李想重回“苦日子”?-钛媒体官方网站 盈利没保住,小鹏品控又“翻车”-钛媒体官方网站 硅谷大裁员,韩企争红利,揭露了AI带来的“生死问题”-钛媒体官方网站 宁德时代花了30亿,为储能建了一个“风洞”-钛媒体官方网站 万科股东会只剩一个老面孔-钛媒体官方网站 小米AI的"免费获客-黑箱锁死"闭环:从100T Token到Credits陷阱-钛媒体官方网站 大模型的另一种活法,被MiniMax跑通了-钛媒体官方网站 AI写小说的套路被扒光了: Claude爱平铺,GPT总做梦,Gemini只会“他如何如何”-钛媒体官方网站 Edge AI Daily 早报(5月31日)-钛媒体官方网站 纯债基金深度掘金:2026Q1市场洞察与精选策略-钛媒体官方网站 价值判断:涨停板的投资机会和风险提示(5月29日)|证券市场观察-钛媒体官方网站 为什么价值创造,才是市值管理的核心-钛媒体官方网站 3只航空航天类股票已准备好乘上售后市场反弹的东风-钛媒体官方网站 我们看好的戴尔股票涨势惊人,我们会继续坚持持有-钛媒体官方网站 A股连续下跌,市值蒸发近40亿元,君实生物深陷合规漩涡?-钛媒体官方网站 霸王茶姬进韩国,排队188分钟,带来哪些启示? 宁德时代掏30亿建了全球第一的“储能擂台”,储能行业还有什么秘密? 小扎要和老黄“亲儿子”抢饭吃-钛媒体官方网站 Digital Quant 2026 量化交易大赛收官:真实资金、真实数据、真实竞争定义“AI 量化新标准” 中餐出海进阶:狂飙过后,该算账了-钛媒体官方网站 【数智周报】华为发表半导体韬定律,5年内冲刺等效1.4nm制程;MiniMax将A股上市;宇树科技冲刺科创板;Anthropic融资650亿美元,投后估值超OpenAI-钛媒体官方网站 “既要又要”时代,雅迪摩登解锁女性出行最优解-钛媒体官方网站 700亿融资赶紧到位吧,DeepSeek开始限制重生、修改次数了-钛媒体官方网站 铜价奔向10.5万背后: 新能源吃铜,铜也正在改变新能源的胃口 一只“死鸡”,能骗走你多少钱?-钛媒体官方网站 供应商变股东:存储芯片三巨头联手入股Anthropic,AI供应链的权力结构正在重组-钛媒体官方网站 市场不会永远低估腾讯-钛媒体官方网站 分析师观点汇总:英伟达仍是AI核心引擎;沃尔玛等五只股票受关注-钛媒体官方网站 2026上海SNEC前瞻:从“反内卷”到“反谍”,从旧范式到新生态-钛媒体官方网站 段永平,又给老家捐了1万股茅台-钛媒体官方网站 告别“邮政内循环”,中邮人寿迎来首位“外来”掌舵人-钛媒体官方网站 没有下一个泡泡玛特-钛媒体官方网站 AI 编程终于有全局视野了,3 万 Star 项目补齐最大短板-钛媒体官方网站 社区硬折扣超市狂飙的AB面-钛媒体官方网站 3小时卖爆2200万!铜师傅借“修仙”翻红,但离飞升还差几个本命法宝?-钛媒体官方网站 新茶饮“蛇吞象”,柠季洽购哈根达斯?-钛媒体官方网站 一手实测,Opus 4.8 Vs ChatGPT 5.5 Vs Kimi 2.6 ,谁最可用?-钛媒体官方网站 Anthropic估值万亿,但Claude 4.8没那么惊艳-钛媒体官方网站 Claude Opus 4.8:两个0%背后的商业逻辑-钛媒体官方网站 拿下世界杯,小红书里能不能长出另一个足球“社区”?-钛媒体官方网站 一个60亿美妆品牌决定去做药-钛媒体官方网站 全国30%的教室都需要它,江西这个“木匠窝”,何以托举教育事业的过去和未来?-钛媒体官方网站 动漫暑期档:年番保基本盘,新题材赌未来-钛媒体官方网站 新鲜零食融资百亿,零食版“蜜雪冰城”要来了?-钛媒体官方网站 从IP到AI,名创优品「十元店」的翻身仗-钛媒体官方网站 没有大厂总部,萧山凭什么抢下AI制高点?-钛媒体官方网站 《ENEMY》筹备中长剧,影视圈又从短视频「捞人」了-钛媒体官方网站 婴儿期的自变量上门保姆应该“0元购”-钛媒体官方网站 量子计算迎来“晶圆厂时刻”,谁先受益?-钛媒体官方网站 Edge AI Daily 早报(5月30日)-钛媒体官方网站 科创新源2.45亿控股东莞兆科,盈利压力凸显加码散热谋变 | 并购一线-钛媒体官方网站 China's Agricultural Robot Startup is Now Valued at over 500 Mln Yuan in Three Months After Inception-钛媒体官方网站 Hangzhou-based Dexterous Robotic Hand Startup Raises Nearly RMB 1 Billion in Six Months-钛媒体官方网站 减持与开庭赛跑,庄园牧场IPO承诺成“空头支票”,前老板携国资血亏上演罗生门-钛媒体官方网站 绿皮火车,怎么就成了3万亿的好生意?-钛媒体官方网站 尼泊尔的草,中国人的宝-钛媒体官方网站 160亿,深圳“四小龙”跑出首个IPO-钛媒体官方网站 435 万的法拉利Luce,撕掉超豪华遮羞布-钛媒体官方网站 浙江小县城“老头乐”,又要IPO了-钛媒体官方网站 Anthropic发布Claude Opus 4.8,重点是:“我不会骗你”-钛媒体官方网站 华为发布“韬(τ)定律”,重构后摩尔时代的中国技术路径-钛媒体官方网站 法拉利第一台电车,绕开了保时捷和仰望-钛媒体官方网站 被AI替代的人,和没被替代的人,差在哪?-钛媒体官方网站 疯狂的Anthropic-钛媒体官方网站 2026世界杯,为什么小红书买了,抖音没买?-钛媒体官方网站 炒币年赚80亿,以色列Biotech顿悟了-钛媒体官方网站 全球创新药最后一个万亿级未开垦市场-钛媒体官方网站 李开复背叛李开复-钛媒体官方网站 年赚27亿、复合增长62%,卖给美国人的阿麦斯凭什么逆势冲刺“中国糖果第一股”?-钛媒体官方网站
接连两位大咖出走,谷歌到底出了什么BUG?-钛媒体官方网站
字母AI2026.06.20 16:33 · 来自北京全文4844字00:00 / 12:47 · 2026-06-20 · via 钛媒体:引领未来商业与生活新知

文 | 字母AI

不到一个礼拜,接连两位重量级员工都离开了谷歌。

前有Google DeepMind工程副总裁诺姆·沙泽尔(Noam Shazeer),后有AlphaFold核心负责人约翰·江珀(John Jumper)。

讲真的,我很难不怀疑谷歌现在“出BUG”了。

从Gemini 3问世,到现在都过去大半年了,谷歌还是只有差别不大的Gemini 3.1。你再看看Anthropic这边,半年前还只是Opus 4.5,现在Fable 5都停用一个多礼拜了。

不只是模型掉队,产品也跟着掉队。如今几乎所有的AI公司都在发力AI Agent,OpenAI有Codex,Anthropic有Claude Code。

Fable 5加持下的Claude Code,现在都能自主修bug,自动循环跑测试直到全绿,还能从设计稿直接生成生产代码,最后封装成完整的软件。

而谷歌这边,只有一个拿不出手的Antigravity 2.0,不仅效果糟糕,使用体验也一言难尽,网上对这个产品只有一片骂声。

说到这里就不得不提一件事,伯克希尔从2025年就开始建仓谷歌,到了2026年第一季度,伯克希尔把谷歌的持仓又加了224%。

2026年6月1日,伯克希尔以定向增发的方式向谷歌母公司Alphabet再投了100亿美元。

难道这回巴菲特真的看走眼了?

谷歌的全栈优势怎么没了?

2025年11月18日,谷歌发布了Gemini 3。皮查伊亲自出来站台,说这是谷歌“最智能的模型”,拥有全球最顶尖的推理能力,多模态理解,还有代码生成能力。

于是在同一天,谷歌还放出了另外两样东西:一个是Google Antigravity,号称“agent-first”的开发平台;一个是Nano Banana Pro,它是谷歌此前爆火的文生图模型Nano Banana的威力加强版。

当时的谷歌有多吓人?这么说吧,在谷歌这场产品发布会结束后两个礼拜,奥特曼向OpenAI内部发出“Code Red(红色警报)”备忘录,称ChatGPT的产品体验与质量优势正在被谷歌快速追近,因此全公司暂停所有其他业务,集结全员投入到ChatGPT当中。

奥特曼担心的不只是这三个产品,而是谷歌的全栈优势。

在硬件上,谷歌有自研的TPU芯片。谷歌从2015年就开始做TPU,到今天已经到了第七代Ironwood,一颗芯片顶过去四颗的算力,液冷散热,一个pod塞进去9216颗芯片,提供42.5 ExaFlops的算力。

和英伟达那种通用的GPU不同,TPU是专门为AI推理任务进行过优化的,成本低,而且性能更好。

再往上一层是DeepMind。

2023年4月,谷歌把Google Brain和DeepMind合并成了一个单位。此前,这两家虽然是同一家公司,但长期以来是两套体系、两套文化,Brain偏产品和商业化,DeepMind偏长期研究。

合并之后,哈萨比斯统一带队,杰夫·迪恩(Jeff Dean)退居首席科学家。也就是说,谷歌的“左右脑”合一了。

继续往上,还有一层很多人容易忽略的东西:入口。谷歌不是只有模型,它有Chrome、Android、YouTube、Google Maps、Gmail、Google Workspace、Google Search。

这些东西加起来,日活几十亿。全世界没有任何一家AI公司拥有这个量级的用户。它能通过入口去铺产品,再用这些成熟的产品拿到用户反馈,加快整个产品的开发迭代。

比如用户在哪一步退出了,哪种能力被反复调用,哪些生成结果被用户改掉了或者直接放弃了,哪些功能形成了留存,哪些场景出现大量报错和投诉。

就拿Nano Banana来说。

这个产品虽然体量非常小,但是它其实是通过谷歌的全栈,拥有自己一个完整飞轮。

Nano Banana刚刚在LM Arena一类的盲测环境里走红后,谷歌做的第一件事就是把它立刻上线到Gemini App、AI Studio、Gemini API当中,甚至连专门面向企业的Vertex AI也没放过。

用户不仅能通过各种产品感受Nano Banana,谷歌还能用这些产品收集反馈,这也就是为什么Nano Banana产品迭代速度那么快,碾压GPT-4o的作图能力。

那为什么到现在,谷歌的全栈优势没了呢?

文生图是一个低风险、短链路、结果立刻可见的产品。

用户输入一句话,几十秒后得到一张图,不满意就重来,满意就分享。它不需要长期记忆,也不需要调用工具权限,更不需要为一次错误承担现实后果。

但是Agent不一样。它不是“给用户一个结果”,它是要彻底驻扎进用户的工作环境,持续读取上下文、调用工具、执行操作,并对最后的结果负责。

Nano Banana的成功并不能完全复刻到Agent了。

当产品需要跨模型、权限、执行环境、企业系统和长期责任时,谷歌那套原本强大的全栈能力,开始显露出协调不起来的问题。

谷歌真正的病是组织架构太混乱

如果你去翻谷歌的开发者产品线,你会发现一个很诡异的现象。谷歌同时有好几个工具,都在帮你用AI写代码,产品功能几乎都重叠了。

Gemini CLI,一个命令行工具,可以查代码库、生成应用、自动执行复杂流程,2025年底随Gemini 3一起推出。到了2026年6月,谷歌发了个公告:Gemini CLI即将被Antigravity CLI取代。

Jules,一个异步编码Agent,Google Labs出品,定位是自动帮你修bug、写测试、提Pull Request。它不需要你盯着看,你把任务扔给它,它自己克隆仓库、写代码、开PR,干完了通知你。

Code Assist,Google Cloud旗下的企业级编程助手,装在VS Code和JetBrains里用,收费22.8到54美元一个用户一个月。Firebase Studio,浏览器里的全栈开发工作台,内置了Gemini,也能帮你生成代码。

然后是永远扶不上墙的Antigravity,前文也提到了,2026年5月I/O大会上又发了个2.0版本,分了桌面App、CLI、SDK、Managed Agents、企业层五块。

它们都在做同一件,但它们是不同团队做的,有不同的品牌名,有不同的入口,有不同的收费模式,甚至有的在互相替代。

这种情况根本就不叫产品线丰富,这叫浪费算力。

这件事的根源其实是在组织架构层面。

谷歌的AI Agent相关能力,被拆分在至少几个互不统属的组织手里。每个组织有自己的KPI,独立的汇报线。

比如Google DeepMind,它管的是模型在benchmark上的分数能不能压过GPT和Claude。DeepMind的成功是“我们做出了最强的模型”。

它根本不关心用户在Antigravity里完成一个真实项目的成功率是多少。

到了Google Labs部门,它只管这个东西酷不酷,能不能在社交媒体上引发讨论。

Google Labs的产品有CC(Gmail里的AI助理)、Project Genie(无限世界生成)、Pomelli(AI营销工具)、Opal(自然语言做小应用),以及Jules。

实验跑完了,热度过去了,团队可能去做下一个实验了,它不会对产品进行长期维护。

Google Cloud和Vertex AI管的是模型能不能通过API调用,企业能不能采购,权限和合规有没有覆盖,Agent能不能部署到生产环境。

Antigravity更惨,它是从Google DeepMind里面走出来的,现在归Google Labs维护。但是又必须接入Google Cloud的权限、部署和合规体系。

所以谁也不会对它负责,就这么摆烂。

你可能会问了,那到皮查伊这关可怎么办?

DeepMind说,我们的模型又刷榜了。Labs说,Jules在社交网络上又有10万转发了。然后Google Cloud那边说,Agent Engine又签了多少个企业客户。Gemini App说,这个月的DAU稳住了。Search说,AI Overviews用户破20亿。

大家的饭碗都保住了,却最后留给Antigravity一地鸡毛。

但没有人能回答一个最简单的问题:一个开发者,今天应该用谷歌的哪一个工具来完成他的工作?如果他现在用的是Codex或者Claude Code,谷歌准备用哪个产品把他抢过来?

评测赢了,不等于任务真的交付了

谷歌现在所有的叙事都只围绕着评分,但现在大家早就不迷信benchmark了,能交付任务的才是好模型。

模型在benchmark上分数高,比如它推理题能答对,代码能生成,图像能看懂,多轮对话能保持连贯。

这些测试通常是在受控环境下进行的。单轮或有限轮次,输入输出干净,不需要操作外部工具,不需要管理权限,不需要长时间持续运行。

失败了的表现是什么?答案不对。最坏的结果,就是重来一遍。

但是到了任务交付这块,模型的价值变了。

用户把一个真实的工作扔给AI,到最后拿到了一个能用的结果,中间的链条其实是非常长的。

什么叫“真实的工作”?是“这个项目的支付模块有个bug,请定位、修复、测试、提交PR”。它涉及多个步骤,可能要花几十分钟甚至几个小时,中间需要调用Git、终端、浏览器、文件系统、API,每一步都有失败的可能。

失败了的表现是什么?不是答案不对,而是代码改坏了、权限控不住了、流程卡死了、环境崩了、用户不知道从哪里恢复。

我举个例子。

假设一个模型在单步判断上的正确率已经有95%,看起来很强;但一个真实开发任务若需要连续完成20个关键步骤,全部不出错的概率只有0.95^20,约等于36%。

哪怕单步正确率提升到98%,20步全程顺利完成的概率也只有约67%。

所以Agent产品真正的护城河,不是把benchmark再刷高两分,而是给错误恢复、状态保存、权限确认、人工接管、回滚和结果验证做出可靠机制。

但是Antigravity都2.0了,还是没有类似且完整的机制。

你去读Gemini 3的官方博文,皮查伊亲自写的开头,后面跟着的全是benchmark对比表。

但是你现在如果去看OpenAI和Anthropic关于新模型的官方博文,里面全都是各种客户对模型的评价。

不是说benchmark没用。benchmark当然有用,它是一个尺子。但如果一个Agent产品的全部叙事都围绕benchmark展开,那就说明这个模型确实干不了活。

谷歌不可能放弃AI Agent,因为这个板块真的太赚钱了,不信你看看友商们就懂了。

2026年2月,OpenAI的Codex,独立桌面App上线后首周下载量超过100万。仅仅过了两个月,Codex周活用户就达到了400万

Claude Code就更不用说了,Anthropic在2月份的融资材料中就暗示,该产品的年化收入已经突破了20亿美元。

Antigravity 2.0发了一个多月了,现在打开它的官网,你会发现还是没有企业版的定价。

Claude Code可以通过Claude Team按人头付费,Codex可以走GPT Business或者ChatGPT Enterprise,同样是按人头收费。

到了谷歌这里,企业要是想用Antigravity 2.0,你只能走Gemini Enterprise Agent,它会赠送你一些额度让你拿手上玩玩,并不能像OpenAI和Anthropic那样,把它变成一个收费的产品。

所以我猜沙泽尔和江珀离开谷歌,大概也是因为对这家公司失望了。