惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

The Register - Security
The Register - Security
美团技术团队
Recent Announcements
Recent Announcements
MongoDB | Blog
MongoDB | Blog
Jina AI
Jina AI
C
Check Point Blog
aimingoo的专栏
aimingoo的专栏
I
InfoQ
S
Securelist
T
Tor Project blog
GbyAI
GbyAI
L
LINUX DO - 热门话题
V
Visual Studio Blog
AWS News Blog
AWS News Blog
The Cloudflare Blog
腾讯CDC
K
Kaspersky official blog
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
Recorded Future
Recorded Future
李成银的技术随笔
W
WeLiveSecurity
Cyber Security Advisories - MS-ISAC
Cyber Security Advisories - MS-ISAC
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
M
Microsoft Research Blog - Microsoft Research
G
Google Developers Blog
酷 壳 – CoolShell
酷 壳 – CoolShell
Schneier on Security
Schneier on Security
B
Blog
IT之家
IT之家
爱范儿
爱范儿
H
Help Net Security
Simon Willison's Weblog
Simon Willison's Weblog
NISL@THU
NISL@THU
J
Java Code Geeks
博客园 - 聂微东
T
The Exploit Database - CXSecurity.com
Cyberwarzone
Cyberwarzone
博客园 - 叶小钗
MyScale Blog
MyScale Blog
Application and Cybersecurity Blog
Application and Cybersecurity Blog
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
Project Zero
Project Zero
F
Future of Privacy Forum
D
Darknet – Hacking Tools, Hacker News & Cyber Security
CTFtime.org: upcoming CTF events
CTFtime.org: upcoming CTF events
Hacker News: Ask HN
Hacker News: Ask HN
D
Docker
Apple Machine Learning Research
Apple Machine Learning Research
B
Blog RSS Feed
V
Vulnerabilities – Threatpost

InfoQ - 促进软件开发领域知识与创新的传播

Navigation API 达基线版本,已经可以作为 History API 的替代方案使用 Cloudflare与Stripe推出新协议,让AI智能体创建账号、购买域名和进行生产部署 词元时代,万物智能 | 摩尔线程2026产品发布会:打造全场景AI算力基石 马斯克要当“太空版黄仁勋”:Anthropic一年上交150亿美元,Cursor百亿分手费锁死,SpaceX成新算力庄家 中国最神秘AI孵化器正式亮相:11位“大佬”导师成为超强外挂 从兼容 CUDA 到自我进化,摩尔线程想用 MUSA 解决真正的难题 OpenAI开源Symphony:面向自主编码智能体编排的SPEC规范文档 Ubuntu拥抱本地AI,而非云优先的操作系统集成 企业级Agent 落地,绕不开的 4 个工程问题 微软发布Aspire 13.3,迎来部署与前端重磅更新 腾讯混元世界模型的研发布局与思考|AICon上海 阿里发布新一代千问旗舰模型Qwen3.7-Max,登顶最佳国产模型 谷歌推出Cloud Fraud Defense,作为reCAPTCHA的继任者 AI Agent 最大的问题:它在企业里只是个“无名之辈” | 技术趋势 Cloudflare 推出支持确定性执行和 5 万个并发工作流的 Workflows V2 对话灵感实验室:全帧率 VLM、低成本与分层部署,业务现场不止需要炫技模型 10 天 3000 元,一人造出全球 AI 爆款!好莱坞导演抢人、游戏版引爆期待,合作细节首次披露 Anthropic 推出 Routines for Claude Code Snowflake Intelligence 合作伙伴生态:把 AI 能力带入千行百业 |技术趋势 一个隐蔽的循环依赖如何导致了 Discord 3 月份的语音服务中断 Arm 携手通义实验室,发起手机上的创意 AI 挑战赛 基准测试表明:AI智能体可修复独立漏洞,却难以理解系统范围影响 CIO 正在抛弃 AI 生码率:一场关于什么才算产研提效的实践复盘 外行式 Vibe Coding 正跟专业的Agent 工程走向融合:最吓人的是,我们“摆烂”有正当理由了? 不换 Kimi 底座,1/10 成本追平 Opus 4.7?Cursor 用 Composer 2.5 反击 Claude Code Snowflake Intelligence:从回答问题到执行任务的个人工作 Agent | 技术趋势 SolidJS 2.0 Beta:一级异步支持、重构的Suspense与确定性批处理 训推一体潮汐弹性:蚂蚁集团在智算基础设施的池化调度实践|AICon上海 如何在软件组织中扩展社会化的系统 Moonrepo发布moon v2.0:引入WASM插件工具链并重构CLI 蜂群Agent来了!openJiuwen社区发布JiuwenSwarm,引领Coordination Engineering新范式 Pinterest 工程师消除 CPU 僵尸进程,解决生产环境瓶颈 AMD苏妈对话李开复:AI转型只能由CEO驱动、未来“DRI”(直接负责人)将是企业核心|直击现场 8大岗位AI技能图谱 Anthropic发布工程事故报告,说明六周来Claude Code质量下降源于三项产品调整 05·29 腾讯云「数据库+AI」产品发布会重磅启幕 Airbnb 采用基于上下文的身份识别模型,支持隐私优先的社交功能 Anthropic首次揭秘下一代Claude怎么造!用户吐槽直接喂模型,连AI“做梦”都被训练 消息积压方面的数学知识:用于队列恢复的容量规划 Netflix借助Apache Druid中的区间感知缓存让84%的查询结果直接命中缓存 小红书 vibe coding 平台(Muse)之高可用人机共创 Agentic 系统架构实践|AICon上海 时序存储:影响成本与性能的设计选择 Cangjie:一门新的开源编译型语言,原生支持效应处理器和代数数据类型 Snowflake Observe:可观测性与 AI 数据云的融合 | 技术趋势 Golden Question 征集令|把你的 AI 落地之问带去 Snowflake Summit 26 H200还没到中国,Anthropic先急了:千亿美元抢芯片,转头涨价让开发者买单 曝Kimi 后训练团队研究员离职,曾为K2.5贡献者;MiniMax最新招聘,兼职也拿期权;传蜜雪CEO隔空回复黄仁勋,“大佬同款”卖爆|AI周报 从第一性原理出发:那些构建 Snowflake 的理念,以及下一步走向 | 技术趋势 Coder Agents让企业能够在自托管基础设施上运行AI编码工作流 超越基准:采用基于指标的方法在真实设备上维持iOS长期的良好性能 Java新闻汇总:GraalVM、Spring AI、JobRunr、GlassFish、Grails、Groovy和Quarkus Agent MCP 一个二十多年老兵的忧心:那条从Debug开始走向资深工程师的路,正在崩塌 从 Vibe Coding 到需求托管交付 Agent,菜鸟 AI 研发效能实践|AICon上海 从批处理迁移到微批次流式处理的实战经验 AI 的“最后一公里”:本地执行与全场景硬件接入的下一代 Agent 中枢|AICon上海 ChatGPT 可以帮你理财了,但它也知道你的全部余额!用户:谢谢不用了 记忆感知的大模型 KVCache 优化|AICon上海 Kubernetes v1.36 发布:安全默认配置强化,AI 工作负载支持日趋成熟 百度想明白了:旧供给到达极限了 “一人公司”正在重做AI创业?极客部落首场16个OPC项目路演:AI 创业已从“卷模型”转向“卷闭环” 当AI助手进化为自主智能体:英伟达如何携手 SAP 重构企业级“信任逻辑”? JEP 533 加强 JDK 27 中 Java 结构化并发的异常处理 兼顾效率、成本与能力,百灵开源旗舰推理模型 Ring-2.6-1T Grafana Pyroscope 2.0:实现持续性能分析规模化落地 AdonisJS v7 推出端到端类型安全、经过重构的项目模板以及零配置 OpenTelemetry Anthropic 推出 Claude Platform on AWS 鼠标每动一下都在训练AI,Meta员工“造反”了:厕所、会议室都贴满抗议传单 GitHub 推出 MCP 服务器集成,全面扩展机密扫描功能 蚂蚁灵波开源LingBot-VLA真机后训练全流程代码,150条示教数据即可适配新机器人 科大讯飞面向超大规模教育场景的 Agent 系统架构演进与工程实践|AICon上海 复制失败与脏碎片:Linux 页面缓存漏洞影响所有主流发行版 当 Agent 开始接管工作流,企业最在意的三件事:安全运行、稳定交付、持续进化 当 Agent 开始接管工作流,企业最在意的三件事:安全运行、稳定交付、持续进化 龙虾犯错,员工背锅?Agent 需要安全、稳定与持续进化的底座 拒掉字节、谷歌橄榄枝,Meta 离职大佬田渊栋官宣自立门户!苏妈老黄追着投 把 UI 生成接进流水线:基于半监督评测体系的 UI 自动化生产实践 AWS 改进 Aurora Serverless:扩容速度提升 45%,吞吐量提高 30% 从服务器 OS 到 Agent 沙箱:腾讯云如何打通 AI Infra 的生态底座 AWS WorkSpaces 支持 AI 智能体直接操作遗留桌面应用程序 Gemini 进手机,Android 翻身;Gemini进电脑,全网开喷! 本地优先 AI 推理:高性价比文档处理云架构模式 前阿里Qwen负责人林俊旸再创业,新AI Lab估值136亿元 黄仁勋最后一刻登上访华飞机,英伟达中国市场再添变量 Netflix 推出“模型生命周期图”,扩展企业级机器学习 AI Agent 沙箱的网络安全:从流量隔离到智能治理|AICon上海 谷歌 DORA 团队发布新报告:扎实的工程基础决定了 AI 投资回报 从「自我进化」到「DAA」,百度给出 Agent 时代系统答案 MySQL 9.7 发布:8.4 之后首个 LTS 正式版,企业级功能下放社区版 当 AI Agent 走进生产数据库,DBA 的角色正在被重新定义 GitHub 如何保障现代CI/CD系统中智能体工作流的安全 Manus 交易失败后,创始人仍在谈论 Agent 时代的成功经验 MediaTek 发布 AI 与游戏开发新工具,聚焦端侧智能体与移动图形能力 把 RAG 做成主流的公司,现在开始“做空”RAG 了 6 天、96 万行 Rust、直接合并?Claude Code 被 Bun 的内存泄漏拖垮后,Bun 让 Claude 亲手重写了自己 摩尔线程 MUSA 合入SGLang主线,国产GPU开源生态从“代码共建”迈入“原生支持时代” 智能体成新型攻击入口?模型上线前OpenAI内部到底审什么?董事会成员首次详解 Cloudflare 推出 Artifacts Beta 测试版,为 AI 代理引入类似 Git 的版本控制功能 在软件设计中应用当下最佳简易系统 Cortex 智能代理:赋能 Snowflake Intelligence 打造企业级 AI 代理核心平台 |技术趋势 局中局!给 Agent 装上 OpenViking,它们竟然学会了“记仇”和“伪装”?
Altman拿Token换股权只够烧45天,20亿Token捐母校只值100块:Token真成“钱”了,谁更赚?
褚杏娟 · 2026-05-21 · via InfoQ - 促进软件开发领域知识与创新的传播

今天,YC 合伙人 Tyler Bosmeny 在 x 上表示,Sam Altman 刚刚向 YC 当前这一期的每一家创业公司提出,用 200 万美元的 OpenAI tokens 换取股权。

Bosmeny 表示,“这有点像当年 Sam 还在 YC 做合伙人时,Yuri Milner 曾提出投资每一家创业公司。我已经迫不及待想看看,当你让那些最有驱动力、最有创造力、最强悍的创始人们把 token 用到极致时,会解锁出什么东西。”

对此,Altman 也在 x 上回应称,“我很期待看到这些把 token 用到极致的创业公司会发生什么变化,无论是它们内部的工作方式,还是它们能够打造出的产品。”

200 万美元听起来不少了,但是一旦换算成 token,那这笔帐就不一样了。

据悉,现在归入 OpenAI 旗下的 OpenClaw 创始人 Peter Steinberger 在一个月内就会花掉 130 万美元的 tokens,而这笔账由他的雇主 OpenAI 买单。Peter 表示,其中大部分开销都用于开发 OpenClaw,他每天的花费接近 2 万美元。算下来,200 万美元的 token 只够“龙虾之父”造一个半月的。

对于一家 token maxxing 的创业公司来说,假设按照 Peter 的使用量来算(理论上应该更高),OpenAI 免费供你一个半月的 token,就能拿走你的部分股权,你干不干吧?

“200 万美元的 token 听起来很多,但一旦你把智能体接上长工具调用轨迹(long tool trajectory),就会发现其实也没那么夸张。”个人 builder ByteCrafter 说道。

“我们这个跑在 4 个平台上的分诊智能体,推理消耗比我预想中快得多,主要是工具输出会不断吃掉上下文。后来,我们在每次输出重新进入上下文之前,先加了一个便宜的 Haiku 摘要器,确实帮我们省回了相当一大块成本。”他随后追问:有人真正按任务粒度做过 token 成本埋点吗?还是说,对大多数人来说,这事现在仍然主要靠感觉判断?

当然,不是每个人都有 Peter 的消耗量。有开发者称,自己整个 AI 开销就是每周在 Codex 上花 200 美元,而且两三天就用完了。“200 万美元的 token,差不多相当于我这笔账单 192 年的额度。真想看看,当团队不用再精打细算 token 时,到底能做出什么东西。”但这个情况可能并不够“tokenmaxxing” 。

无论如何,这事儿对 OpenAI 来说一定是划算的。

有网友表示,这基本上就是终极版的供应商锁定策略。发放 200 万美元免费额度,等于确保整整一代 YC 创业公司都把核心基础设施建在一个封闭生态上。等补贴耗尽时,它们已经负担不起迁移成本,也离不开这个体系了。

也有网友指出,这是一个聪明、低风险的决策:直接从 Anthropic 手里抢竞争筹码。YC 公司一旦成功,就会使用越来越多的 OpenAI token。这样一来,OpenAI 不仅能把这 200 万美元赚回来,甚至还能赚更多。而且,这会形成一个黏性极强的创业公司群体,因为他们会一直记得:自己能走到今天,是因为你当初帮了他们。除此之外,OpenAI 还拿到了股权。

“Token 真的变成金融证券了?”有网友忍不住问道。但如果 Token 真成了 money,那它先不是货币化,而是先带来了“津巴布韦式”的大通胀。

但这种事儿并不只发生在了硅谷。

与传统校友捐赠图书馆、奖学金或教学楼不同,三位 00 后选择向母校捐赠价值 20 亿的 token。

据媒体报道,5 月 13 日下午,郑州西亚斯学院外语学部报告厅,数百个“Token 蛋”盲盒被学生一抢而空。这些盲盒里装的不是普通礼品,而是总计 20 亿的 AI Token。这批 Token 可用于跨境生意 AI 工作台 Accio Work,预计能覆盖约 500 名在校学生一个月的使用费用。

这批 Token 的捐赠者,是三位从郑州西亚斯学院走出的“00 后”创业者:何佳坤、李佳乐、王腾。他们都在校期间或毕业后进入跨境电商领域,其中有人已经把外贸年销售额做到千万元级别。

“3 年前创业时我没有 AI,如果有,从 0 到 3000 万的速度会快一倍。”何佳坤在创业分享会上说。除了捐赠 Token,三人还现场分享了适合“一人公司”、外贸新手和学生创业者使用的 AI Skill 应用方法,试图把自身经验沉淀成可复制的工具和流程。

20 亿 token 也是一个听起来很唬人的数字,但有网友表示,按照 ds4 1 亿 5 块钱计算,这相当于给母校捐款 100 块钱。“搞半天 20 亿 token 都不如手上拿着那张捐赠证书值钱。”其评价道。

DeepSeek 两款模型当前价格表,deepseek-v4-pro 现 2.5 折,优惠期至 5 月 31 日 

知乎上,网友“杰拉德笔下的男人”表示,“20 亿 Token,放在大模型世界里,差不多是十几亿个字。这相当于把整套《三国演义》让 AI 读上上千遍。对一个多数人来说,一辈子也写不出这么多字,读也读不完。但在工作中,比如一个程序员,如果连着大模型的 API 天天洗数据、写代码、测代码,一天用个上亿 Token,真不难事。这也是为什么很多打工人一看到 20 亿,第一反应是这点钱够干嘛,跑两天就没了。”

觉得自己 AI 落后了,那就“tokenmaxxing” ?

欢迎来到 “tokenmaxxing” 的时代。

如果你担心自己在 AI 上已经落后了,开发者 Sigrid Jin 给出了一条建议:大量使用 AI,直到你的月度账单差不多能和房租相提并论。Jin 认为,“tokenmaxxing”是理解 AI 价值的最佳方式,他自己一年内就使用了 500 亿 token。

Jin 在 3 月底走红。当时 Anthropic 意外泄露了 Claude Code 的源代码,他随后重建了 Claude Code 的代码库。为了避免遭到这家 AI 实验室的版权下架,他用 Python 重新写了一遍。这场 tokenmaxxing 确实带来了回报:Jin 创建了史上增长最快的 GitHub 仓库,名叫 Claw Code。此后,Jin 收到了几家 AI 实验室的工作邀请,但他决定把精力放在个人项目上。他计划在下个月创办一家创业公司。

Jin 认为,大多数人并没有真正体验到 AI 能提供多少价值,因为他们用的只是免费版,或者每月 20 美元的订阅套餐。他表示,那些只使用基础版 AI 的人,正在错过 200 美元套餐所能提供的“更高智能”,这些更高阶套餐能带来更清晰的投资回报。

“如果你想知道 AI 的未来是什么样,就试试 tokenmaxxing。”他还补充说,自己会建议朋友,“在 AI 上花的钱,尽量接近你每个月付的房租”,这样才能获得“投资回报”。

这种回报可能表现为“同时运营多项业务”,也可能是把日常生活中的常见任务交给 AI agent 来处理。Jin 表示,AI 的成本效益没有一套通用衡量方式。每家公司、每个个人使用这项技术的方式都不同,因此需要建立自己的基准,用来衡量回报。

如此同时,越来越多公司花在 AI 账单上的钱,已经超过了支付给人类员工的薪水。但问题是,AI 带来的收入必须超过 token 成本,才能证明这些支出是合理的。对于企业用户来说,尤其如此。

推高 token 消耗的压力,短期内不会消退。当被问到要使用更多 token 时是否感到有压力,Jin 的回答是:“是的,当然。”

这种 tokenmaxxing 的执念也出现在企业中,员工不得不像有些某宝刷量的商家一样,为自己的 token 刷量。

此前 The Information 报道称,一些 Meta 工程师正在竞相消耗 token,只为登上一个由员工自制的 “Claudeonomics” 仪表盘排行榜。这个仪表盘会追踪使用量,并让员工争夺类似 “Token Legend” 这样的称号。

“按 token 消耗量给工程师排名,就像我按谁花钱最多来给市场团队排名一样。不要把高烧钱速度误认为高成功率。”Linear COO Cristina Cordova 在 X 上写道。

据悉,Meta、OpenAI、Anthropic 等公司内部都设有 token 排行榜。

这也逐渐变成一种炫耀方式。创始人和前沿工程师会在 X 上晒出自己的 token 消耗量,以此表明自己对 AI 的投入程度。一名 xAI 员工写道,科技行业正在把每一个好想法都变成“表演”。

有人在 X 上写道:“我个人每周会在 token 上花掉数千美元……感觉很疯狂,但我停不下 tokenmaxxing。”

YC CEO Garry Tan 似乎也认同这种做法。他转发了一条批评公司在 token 上“抠门”的帖子,并写道:“我们 tokenmaxxing 的时间比大多数人都久。”

tokenmaxxing 是一个好激励吗?科技圈内部对此分歧很大。

Khosla Ventures 合伙人 Jon Chu 在 X 上称,用 token 消耗量作为衡量方式是“绝对愚蠢的政策”。他写道:“不少我在 Meta 的朋友告诉我,因为这项政策,有人已经在写机器人,让它们不停循环运行,用最快速度烧 token。”

Cursor 员工 Edwin Wee Arbus 则谨慎些。他称这个指标是一个“有用、快速的代理指标,但略有缺陷”。他将其类比为身体质量指数 BMI:BMI 可以提供一些健康参考,但无法反映肌肉量或骨量。

也有人持完全相反的看法。

“tokenmaxxing 是我听过最离谱的启发式指标。事实上,我会认为更好的工程师应该能用更少 token 解决问题。”一名用户在 X 上写道。

《The Pragmatic Engineer》作者 Gergely Orosz 认为,这种做法很浪费。他写道:“只要某个指标和更多奖金或晋升挂钩,开发者就会想办法刷它。这个也一样。”

有人用一句话概括了 tokenmaxxing 的问题:“没有 tokenverifying 的 tokenmaxxing,只是 tokenslopping。”也就是说,如果只是烧 token,却不验证结果,那就只是制造一堆 token 垃圾。

在硅谷,巨额 token 预算正在变成开发者之间的一种“荣誉勋章”。但如果用它来衡量生产力,其实非常奇怪。因为 token 消耗衡量的是投入,而你真正关心的应该是产出。如果你的目标是鼓励员工更多使用 AI,或者你本身就在卖 token,那这个指标或许说得通;但如果你的目标是提升效率,那只看 token 消耗就没什么意义。

工程师们不得不回头修改 AI 的代码

不过,最有资格回答这个问题的或许就是 token 消耗大户:软件工程师。

现在,一批做“开发者生产力洞察”的公司发现,使用 Claude Code、Cursor、Codex 这类工具后,开发者确实提交并保留了更多代码。但与此同时,它们也发现,工程师之后不得不更频繁地回头修改这些已经被接受的代码。

这削弱了“AI 显著提升生产力”的说法。

Waydev CEO 兼创始人 Alex Circei 表示,工程管理者看到的 AI 代码接受率通常在 80% 到 90% 之间,但他们往往忽略了后续几周发生的返工和修改。工程师不得不反复修订这些代码,导致现实中的有效接受率被拉低到了 10% 到 30%。

整个行业的数据正在指向一个结论:写出来的代码更多了,但其中相当大一部分并没有真正沉淀下来。

GitClear 公司在今年 1 月发布报告称,AI 工具确实提高了生产力,但“经常使用 AI 的开发者,平均代码流失率是不使用 AI 开发者的 9.4 倍”。这个流失幅度,已经超过了这些工具带来的生产力提升幅度的两倍。

工程分析平台 Faros AI 在 3 月份的报告中,使用了两年的客户数据。结果显示,在 AI 高采用度环境下,代码流失率(也就是删除代码行数相对于新增代码行数的比例)增加了 861%。

面向 AI 融合工程的智能平台 Jellyfish,收集了 2026 年第一季度 7548 名工程师的数据。平台发现,token 预算最高的工程师,确实产出了最多的 PR,但生产力提升并没有等比例放大。他们用 10 倍 token 成本,只换来了 2 倍吞吐量。也就是说,这些工具带来了更多“量”,但不一定带来更多“价值”。

这些统计数据,和很多开发者的真实感受是吻合的。开发者一边享受新工具带来的自由,一边也发现代码审查和技术债正在堆积。一个常见现象是,高级工程师和初级工程师之间差异明显:后者更容易接受 AI 生成的代码,因此后续也要承担更多重写和返工。

大公司们仍在摸索如何高效使用 AI 工具。比如去年,Atlassian 以 10 亿美元收购了另一家工程智能创业公司 DX,目的就是帮助客户理解编程智能体的投资回报率(ROI)。

不过,即便开发者还在努力搞清楚自己的 AI 工具到底在做什么,他们也并不认为行业会很快回到过去。

“这是软件开发的新时代,你必须适应。作为一家公司,你也被迫适应。它不像是一阵风,过了就会消失。”Circei 说道。

Token 狂欢太贵了,经济帐岌岌可危

但是,这场海内外的 token 狂欢,至今还没有把经济帐算通。

“就目前而言,AI 对参与其中的绝大多数人来说,在经济上都不可行。”EZPR CEO Ed Zitron 在发布的最新文章里直接指出。

他认为,真正赚钱的不是 AI 应用公司,也不是大模型实验室,而是建筑公司、英伟达以及围绕数据中心建设受益的硬件供应链。整个行业正在用一种近乎非理性的乐观,押注一个尚未被证明能赚钱的未来。

过去三年,微软、谷歌、Amazon、Meta 等超大规模云厂商已经在 AI 基础设施上投入超过 8000 亿美元,并计划在 2026 年继续投入约 7000 亿美元,2027 年再投入 1 万亿美元。换句话说,仅仅为了打平,它们就需要至少数万亿美元级别的 AI 收入。

但是,这些公司至今都不愿意清晰披露自己的真实 AI 收入。

微软曾称 AI 年化收入达到 370 亿美元,Amazon 也说达到 150 亿美元,但 Ed Zitron 认为,这类“年化收入”只是某个月份的快照,不等于真实收入,更不能说明这门生意已经成立。真正值得注意的是,微软在 OpenAI 合作上累计投入约 1000 亿美元,其中包括原始投资、基础设施建设和托管计算成本。自 2023 财年以来,微软总资本开支约 2938 亿美元,其中接近三成可能都与 OpenAI 基础设施有关。

这就引出了一个更直观的问题:微软花了近 3000 亿美元资本开支,某种意义上是在为 OpenAI 建基础设施,但 OpenAI 本身仍在巨额亏损。即便 Microsoft 365 Copilot 有 2000 万用户,假设每人每月都全价支付 30 美元,最高也不过 72 亿美元年收入,而实际上微软已经多年在给 Copilot 打折销售。

Ed Zitron 估算,微软 2025 财年 AI 收入大约为 179 亿美元,不到其当年资本开支的五分之一,而且这还没有计入数据中心电力、维护、运营、税费、保险等实际运营成本。

在他看来,要让这些 AI 投资成立,必须同时满足四个条件:AI 收入爆炸式增长;资本开支停止继续扩张;GPU 在计入硬件和债务后仍然正毛利;AI 收入在资本开支停止前后都能保持稳定。

但现实恰好相反。AI 收入没有证明能爆炸,资本开支仍在继续,GPU 运行是否真正盈利没有清晰证据,而 AI 收入高度依赖 OpenAI 和 Anthropic 这两家持续亏损的公司。

是的,微软、谷歌、Amazon 的大量未来收入承诺,也主要来自 OpenAI 和 Anthropic。比如 微软的剩余履约义务增长,主要由 OpenAI 和 Anthropic 的云计算承诺推动;谷歌的增长也被 Anthropic 的 TPU 和计算承诺拉动;Amazon 也高度依赖 Anthropic 的大额计算合同。

Ed Zitron 的结论是:除了 OpenAI 和 Anthropic,这些云厂商并没有看到足够大的 AI 收入增长。也就是说,所谓 AI 云收入繁荣,很大程度上来自几家公司互相输血,而不是一个真实、广泛、稳定的市场需求。

如果 AI 真有不可阻挡的企业需求,为什么没有出现更多 OpenAI 或 Anthropic 量级的客户?为什么云厂商的 RPO 增长主要还是靠这两家公司撑起来?

但实际上,AI 实验室自身的财务状况更危险。

AI 支持者常见说法是,芯片会变便宜、模型公司会开始卖服务、推理是盈利的。但 Ed Zitron 认为,没有可靠证据证明 OpenAI 或 Anthropic 在推理上盈利,反而有大量迹象说明它们亏得越来越厉害。

以 Anthropic 为例,根据相关文件,它曾在获得超过 50 亿美元收入的同时,在推理和训练上花掉 100 亿美元。Ed Zitron 据此判断,Anthropic 可能需要花 3 美元计算成本才能换来 1 美元收入,而且这还没算员工、电力和其他运营费用。

更夸张的是,Anthropic 还背负了对谷歌、Amazon、微软的大额云计算承诺,未来几年可能需要支付数千亿美元级别的计算费用。OpenAI 的情况也类似,据 The Information 报道,OpenAI 到 2030 年底可能计划烧掉 8520 亿美元。

Ed Zitron 认为,无论 OpenAI 还是 Anthropic,都没有证明自己能停止大量烧钱。所谓“未来现金流转正”的说法,建立在极其乐观甚至荒唐的收入预测上。一旦需求高于预期,它们必须临时购买更昂贵的算力;如果提前购买太多算力,一旦收入没有跟上,又会陷入破产风险。

这就是所谓的“接刀子问题”:算力买少了不够用,买多了又可能被固定成本拖死。

AI 迎合了“商业白痴”

AI 太贵,不只是云厂商和模型公司的问题,也开始传导到企业客户。

Ed Zitron 指出,Anthropic 近期把企业客户转向 token 计费,这将真正测试 AI 的价值。因为过去很多企业还处在“随便用、先探索”的阶段,工程师被鼓励尽可能多地使用 AI,但公司并不清楚每季度到底会花多少钱,也不知道 ROI 如何计算。

一些大公司已经在几个月内烧完年度 API token 预算。ServiceNow 的 CIO 曾表示,公司正在和 CFO 一起想办法控制成本,以确保员工今年剩下时间还能继续使用 Claude Enterprise。Salesforce CEO Marc Benioff 也表示,2026 年将花 3 亿美元购买 Anthropic token。

一定程度上,这说明当前 AI 收入增长很大程度上来自企业的 token 狂欢,而不一定是可持续需求。很多企业并不知道 AI 的真实价值,也不知道预算该如何制定,只是在 FOMO 情绪下疯狂试用。

Stripe 的例子显示,其 5000 多名技术员工每天平均烧掉约 9.4 万美元 token,每月约 280 万美元,主要用于 Anthropic 编程模型。这个数字对 Stripe 不一定致命,但如果放在人力成本中看,AI 支出已经相当可观。Goldman Sachs 的报告甚至称,AI 成本正在接近总人力成本的 10%,按当前趋势未来几个季度可能接近人力成本本身。

另一个案例是 Zillow。Zillow 2026 年第一季度在 AI 服务上花费超过 100 万美元,4 月又在 Cursor、Anthropic、AWS Bedrock 上花掉 74.9 万美元 token。按当前速度,它 2026 年 AI 支出可能达到 700 万到 1000 万美元,接近其 2025 年净利润的相当大比例。

Zillow 的问题不只是花钱,而是组织正在被 AI 重塑。Zillow 内部提出所谓“AI-Native Engineering”,目标包括让软件工程师“不再打开代码编辑器”,从“AI 辅助”走向“AI 原生”,从“独奏者”变成“指挥家”,再变成“作曲家”,由人类定义规则,agent 执行整个软件开发生命周期。

但现实中,据 Ed Zitron 获得的信息,Zillow 工程资源基本没变,需要人工审查的产出却增加近 50%;代码部署和 PR 增加 39%;代码审查负载每月增加 29000 小时,约等于每位工程师额外多出 19 小时,只是在检查大模型生成的代码。

Blind 上的 Zillow 员工抱怨,代码正在慢慢变成“AI slop”,大量代码在缺乏护栏和充分审查的情况下被批准。有人甚至说,“垃圾就是工作保障”,因为只要 AI 输出足够混乱,管理层就没法轻易用 AI 替代工程师。

当公司把 AI 使用量当作目标,而不是把业务结果和代码质量当作目标,token 烧钱会迅速变成“补贴瞎忙”。

而且,现在的公司很难回答下面的基础问题:完成一个具体任务到底需要多少 token?不同模型是否一致?不同员工是否一致?同一提示词重复执行,消耗是否稳定?如果没有按任务粒度做多次测量,所谓年度 token 预算就像蒙眼扔飞镖。

Ed Zitron 更为犀利地指出,“生成式 AI 之所以能如此流行,是因为它完美迎合了一类脱离真实工作、却掌握决策权的高管和经理。”

普通工程师会告诉老板:“这个时间做不到”“资源不够”“需求不合理”。但 AI 永远不会说不,它会说“当然可以”,然后生成看似像工作的东西:PRD、原型、方案、邮件、幻灯片、代码。哪怕结果很差,它也会道歉,并承诺下次做得更好。

这让高管产生了幻觉:既然 AI 能快速吐出一个原型,那工程师为什么不能更快?既然 AI 从不拒绝,那拒绝的工程师是不是懒?于是,AI 成为管理层压迫执行层的新工具。

Ed Zitron 认为,很多企业不是因为 AI 真的有效才每年烧掉数百万、数亿美元,而是因为它们由并不理解真实工作的人管理。对这类人来说,AI 最大的吸引力不是可靠产出,而是它永远服从、永远积极、永远制造“工作感”。

这也是 Ed Zitron 所谓“商业白痴的复仇”:一个由不做实际工作的人主导的经济,终于遇到了一种最适合骗他们的钱、迎合他们幻觉的技术。

参考链接:

https://x.com/TFTC21/status/2056415353375465505

https://www.businessinsider.com/openclaw-peter-steinberger-ai-token-bill-2026-5?utm_source=chatgpt.com

https://www.businessinsider.com/tokenmaxxing-ai-token-leaderboards-debate-2026-4

https://www.axios.com/2026/05/13/tokenmaxxer-ai-claude-code-codex

https://www.wheresyoured.at/ai-is-too-expensive/

https://techcrunch.com/2026/04/17/tokenmaxxing-is-making-developers-less-productive-than-they-think/?utm_source=chatgpt.com

https://mp.weixin.qq.com/s/PQbE8I7tb4y2swH2BVeuQQ