惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

P
Privacy International News Feed
CTFtime.org: upcoming CTF events
CTFtime.org: upcoming CTF events
Jina AI
Jina AI
T
Tailwind CSS Blog
WordPress大学
WordPress大学
Scott Helme
Scott Helme
C
Cybersecurity and Infrastructure Security Agency CISA
博客园 - Franky
C
CERT Recently Published Vulnerability Notes
cs.AI updates on arXiv.org
cs.AI updates on arXiv.org
雷峰网
雷峰网
Schneier on Security
Schneier on Security
博客园 - 聂微东
T
Tor Project blog
Hugging Face - Blog
Hugging Face - Blog
博客园 - 司徒正美
AI
AI
T
Troy Hunt's Blog
Security Latest
Security Latest
T
The Blog of Author Tim Ferriss
cs.CV updates on arXiv.org
cs.CV updates on arXiv.org
C
Check Point Blog
T
Threat Research - Cisco Blogs
W
WeLiveSecurity
V
Vulnerabilities – Threatpost
Recorded Future
Recorded Future
Recent Commits to openclaw:main
Recent Commits to openclaw:main
Cisco Talos Blog
Cisco Talos Blog
C
CXSECURITY Database RSS Feed - CXSecurity.com
Cloudbric
Cloudbric
J
Java Code Geeks
罗磊的独立博客
C
Cyber Attacks, Cyber Crime and Cyber Security
aimingoo的专栏
aimingoo的专栏
L
LangChain Blog
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
P
Privacy & Cybersecurity Law Blog
Google DeepMind News
Google DeepMind News
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
L
Lohrmann on Cybersecurity
I
InfoQ
MongoDB | Blog
MongoDB | Blog
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
The GitHub Blog
The GitHub Blog
The Hacker News
The Hacker News
H
Help Net Security
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
P
Proofpoint News Feed
N
News and Events Feed by Topic

InfoQ - 促进软件开发领域知识与创新的传播

Meta 收购 Manus 这事儿泡汤了 5.5万 Star 开源项目 Ghostty 被迫出走,GitHub 正在终结一代技术人的乌托邦 Slack 长时运行多智能体系统的上下文管理方案 从 T+1 到分钟级:金城银行基于 Apache Doris 构建高可靠、强一致的实时数据平台 谷歌云推出 Agents CLI,简化 AI 智能体开发全流程 Claude官方击穿高薪、高学历的安全防线!Anthropic点名10大高危职业,但有群人暂时稳了 亚马逊云科技终止 WorkMail 服务,并将 App Runner 转入维护模式 OPPO小布记忆:全模态碎片化内容的理解与智能整理实践|AICon上海 模力工场038周AI应用周榜:工具在消失,工作流在出现 Akamai CEO Tom Leighton:Agent 时代来临,云基础设施正从“中心化”转向“分布式边缘” 日均数百亿入库背后:从“人肉调度”到K8s弹性架构,度小满金融基于OceanBase重构入库架构实践 百度文库网盘发布GenFlow 4.0:月活用户超1亿,要把网盘变成全端AI工作台 Altman 投的 Agent 终端 Warp 开源了!斩获3.5万star 哪些客户需要拒, 敢让龙虾决定吗?_AI&大模型_InfoQ 中文站_InfoQ精选视频 从开发到生产:为什么越来越多的机器学习团队纷纷迁移到 Snowflake | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 探索多智能体工作流:LangGraph Snowflake Cortex AI | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 腾讯云分布式缓存数据库:AI Agent - 从提示词工程到 Harness 工程 | 腾讯云数据库 DBTalk_腾讯_凌敏_InfoQ精选视频 基于 Streamlit 为 CSV 数据构建分析智能体 | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 AI 智能体:告别文档缺漏 | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 构建 AI 驱动的数据管道:深度探讨 Snowflake Openflow 与非结构化数据 | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 云端太贵、本地不够聪明,英特尔押注“端云混合AI”:智能体PC会替人完成工作 不到10%的存储投入,可能拖垮90%的GPU投资!IBM把AI Agent塞进存储系统,算清企业最容易忽略的一笔账 Snowpark 上手实战 | BUILD 2025_大数据_王玮_InfoQ精选视频 ClickHouse + Langfuse,构建 Agent 可观测基石 腾讯云分布式缓存数据库:Cluster Proxy 共享连接架构深度解析 | 腾讯云数据库 DBTalk_腾讯_凌敏_InfoQ精选视频 AI 写代码太烧钱了:Copilot、Claude 一起涨价,不如把程序员请回来? 英特尔发布至强600系列工作站处理器与锐炫Pro B70 GPU,全新AI工作站来了 腾讯云分布式缓存数据库:从 Redis 到 Valkey - 开源社区如何快速创新 | 腾讯云数据库 DBTalk_腾讯_凌敏_InfoQ精选视频 印奇这次要“从0重做”智驾模型!首谈阶跃和千里双公司布局:中国AI商业闭环要靠车跑出来 从Cursor返聘归来,90后华裔女高管带Claude开启日更模式:token成本比工程师工资低多了! 从 Coding 到 Agent:QCon 北京 2026 全景复盘,优秀出品人 & 明星讲师名单揭晓 全链路支撑大模型国产化“Day 0适配”,商汤大装置构建全栈能力底座 凌晨,OpenAI 与亚马逊云科技史上最大联合发布来了 HashiCorp Vault 2.0 发布:引入新身份联邦机制,迈入 IBM 生命周期体系 Yelp 实现超 1,000 个 Cassandra 节点零停机升级 写了 17 年开源代码,我为什么认为 Coding Agents 堆功能是在瞎折腾? 基于 Apache Camel 编排智能体与多模态 AI 管道 面向智能体与人类用户的AI记忆系统:架构设计与核心场景实践|AICon上海 Anthropic 推出 Managed Agents,简化 AI 代理部署流程 阿里HappyHorse开启灰测,720P视频生成低至0.44元/秒 讯飞联合清华团队押注量子AI:不看营收、不设KPI,一群“无人区”科学家,抢夺下代AI算力入口 小米万亿模型全面开源:MIT 协议、1M 上下文,但还是打不过 DeepSeek Cortex Code 入门指南:面向数据工程师的实践路径 | 技术实践 openJiuwen社区首发Team Skills,定义Coordination Engineering新范式 用 Snowflake Cortex Agents 释放结构化数据的最大价值 | 技术实践 Grafana 利用 Kafka 对 Loki 进行了架构重构,并发布了一款命令行工具,旨在将可观测性引入编码代理 ClickHouse重构全文索引:对象存储上跑出高性能 Full-Text Search 可观测性和遥测技术如何提升软件工程实践 Dropbox 与 GitHub 合作,将单体库大小从 87GB 缩减至 20GB Agent 的下一站:基于长期记忆系统 EverOS 的自我演进|AICon上海 同一赛道,四种收费:Agent 控制层(Harness)开始分裂 Cloudflare Sandboxes 正式发布,为 AI 代理提供持久化隔离环境 Agent 的“记忆断片”困局,该怎么破?_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选视频 数据分析师如何快速建立在 AI 时代最值钱的能力:一份可落地的行动路线图 摩尔线程最新财报:研发占比超86%,万卡级大规模智算集群落地 当云区域失效:地缘动荡环境下的高可用重构 Slack 重构通知系统,设置参与度提升 5 倍 智能体工程的隐性技术债务 “我把所有模型都换成了DeepSeek V4”:月账单将降 90%,效果还更好 阿里云智能集团高级技术专家刘少伟已确认出席AICon上海站,并分享如何构建企业 Agent 的自动化行动架构 构建生产就绪的 tRPC API:Apollo Federation 的 TypeScript 替代方案 Anthropic推出面向Claude Code的基于智能体的代码审查功能 北京车展直击:斑马智能甩出车载Agent短剧,比亚迪率先落地,AI让智能座舱又热起来了 Snowflake 作为智能体运行时:从静态管道迈向自主数据系统 | 技术实践 Snowflake 上的本体体系:基于 Cortex Code 能力实现从架构到部署 | 技术实践 Cloudflare 公布 MCP 架构方案,应对企业面临的安全与治理风险 复杂的项目管理怎么做到「AI 友好」?飞书项目用「开放」给出答案 Snowflake Cortex Code 的规范驱动开发:将 SDLC 方法论引入 AI 辅助工作流 | 技术实践 Copilot 不让注册了:从“随便用”到“全面限”,agent 把原有订价模型顶穿了 当互联网用AI卷效率时,这家公司先问了一连串“能不能” Meta 开始记录员工每一次点击:AI 要接管工作,先监控会工作的人 Meta“Token榜”逼疯打工人,一夜烧掉公司几万刀!AI时代Token焦虑越来越离谱 智源FlagOS完成DeepSeek-V4-Flash在八款芯片Day0适配,实现三重技术突破 DeepSeek V4 重磅开源!首次打通华为Ascend,也没丢掉英伟达,百万上下文夺回国产模型话语权 李志飞的“新实验”:当超级个体撞上真实组织 GPT-5.5 登顶时刻,Anthropic 亲口承认 Claude 变笨了!网友群嘲:太敷衍 那些没空写的小需求,龙虾真能做吗?_AI&大模型_InfoQ 中文站_InfoQ精选视频 从 Pandas 到生产:使用任意 IDE 进行可扩展的 ML 数据管道与分布式处理 | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 pnpm 11 候选版本发布,带来 ESM 分发、供应链默认设置以及新的存储格式 银行业PDF表格提取方案重构:基于Java的分层方案 GPT-5.5 赢了 Opus 4.7 和 Mythos?奥特曼晒黄仁勋内部信:英伟达全员用上 Codex! Cloudflare 推出 Think:一款面向 AI 代理的持久化运行时 1850亿美元天价支出、75%代码由AI生成!谷歌正式宣告:全面转向智能体工作流 xAI落后太多,马斯克“开大”重金求购Cursor,100亿美金“分手费”都敢签! Pulumi 新增对 Bun 运行时的全面支持 姚顺雨腾讯模型首秀!不卷参数只做 “听话打工人”,Hy3 preview登场 | 附实测 老板让你“忽悠”投资人,你敢发给龙虾吗?_AI&大模型_InfoQ 中文站_InfoQ精选视频 Gemini CLI 引入子代理机制,实现任务委派与并行代理工作流 清华系团队星工聚将完成数千万天使轮融资,轮式机器人拿下头部制造企业亿级大单 Pretext.js 绕过 DOM 布局重排,实现 120 FPS 的高级交互体验 靠“AI 云”爆红的 Vercel,栽在一个第三方AI工具手里!IPO前夕遭黑,200万美元赎金谈崩? 高能研讨会|端侧 AI 正在重写实时感知效率上限_AI&大模型_王玮_InfoQ精选视频 2050大会看这篇就够了|报名、交通食宿指引大全 Java 近期资讯:OpenJDK JEP、Jakarta EE 12、Spring Framework、Micrometer、Camel、JBang 金融智能的架构编排:基于 Snowflake Cortex Agents 实现结构化与非结构化数据统一分析 | 技术实践 在AK大神爆火的任务里,摸清国产AI真实水平 百灵Ling-2.6-flash 正式发布:高 Token 效率,以 1/10 消耗实现 SOTA 级 Agent 能力 当 PM 懂AI,当技术懂产品:AI 时代产品力的双向进化|PM x AI产品力领航者大会即将开幕 为 AI 智能体设计记忆机制:揭秘 LinkedIn 的认知记忆智能体 获奖名单公布|2026主题征文第一期|分享你最有价值的龙虾场景与核心 Skill_热门活动_InfoQ写作社区官方_InfoQ写作社区
一月烧掉5亿美元才醒悟:把 Token 当 KPI是AI转型里最贵的坑!亚马逊连夜撤下排行榜
四月 · 2026-06-03 · via InfoQ - 促进软件开发领域知识与创新的传播

最近,越来越多公司发现:还没等到 AI 真正改造业务,Token 账单先把自己给改造了。原来 AI 转型里最贵的坑就是把 Token 的使用量当成了员工的 KPI。

某公司的老板大手一挥,给全员开通 Claude 授权,却忘了设上限。一个月烧掉 5 亿美元,折合人民币 30 多亿。等财务反应过来,上亿美元的账单已经在路上。

5 亿美元究竟是怎么烧的?扒开细节,发现其中有相当一大块,都是某些员工跑任务时,反复撞上报错,一遍遍手动点"重试"点出来的。

如果只是一家公司手滑,那叫倒霉。问题是,类似的“事故”一抓一大把

Meta 内部有人做了一个叫 Claudeonomics (Claude 经济学)的榜单,统计谁用 AI 用得最猛。30 天里,全公司烧掉超过 60 万亿个 Token,光“榜一大哥”一人就占了 2810 亿 Token,将近 50 万美金 / 月。

Uber 最早给 5000 名工程师配齐 Claude Code,使用率几个月内猛冲,结果一季度刚过,CTO 就叫苦不迭:2026 全年的 AI 编程预算已提前烧光

国内也不遑多让。在阿里云峰会上,米哈游技术负责人就提到,有员工为了做一个项目,搭了几十个 Agent 协作,一晚上烧掉 200 万人民币的 Token

Token 账单为何会如此失控?

高盛今年 5 月的报告《Decoding the Agentic Economy》点破了真相:在 Agentic 模式下,模型由于需要不断进行“思考 - 检索 - 调用工具 - 重新读取完整上下文”的循环,其 Token 消耗量达到了普通问答模式的 1000 倍

图片

你以为它在思考,其实它也在烧钱。而模型公司、云厂商、芯片公司,更是 心照不宣地把“多用 AI、多烧 Token”包装成了先进生产力的进步。

这时再看 Anthropic 单季度超百亿、估值破万亿美元的造富狂飙,老黄赢麻了的增长曲线,是不是就不难理解了?下游“事故性”烧掉的钱,转身就成了模型公司财报上实打实的进账。同一笔钱,两个视角:一个叫增长,一个叫事故。

亚马逊先动手了

烧掉几亿美元或许是个极端案例,但为了烧钱而烧钱的现象,早就成了科技大厂的通病。

直到亚马逊实在看不下去,第一个动了刀。

亚马逊内部曾有一个叫 KiroRank 的榜单,挂在自家的 Kiro 开发者平台上,按工程师消耗的 Token 量排名。

加上公司此前下了硬指标,要求八成以上员工每周必须用 AI,榜单一出,员工纷纷开始 Tokenmaxxing:派 Agent 去干根本没必要的活,把 Token 烧成排名,再把排名内化成职场安全感。

图片

最后,亚马逊高级副总裁 Dave Treadwell 终于坐不住了,在内部大会上呼吁强调:不要为了用 AI 而用 AI。

榜单随即被下线,新指标也换成了“normalised deployments(标准化部署量)”,衡量工程师到底有没有用 AI 交付出真正有用的代码,而不是单纯数你烧了多少 Token。

作为云计算霸主,亚马逊当然信 AI,但它也亲自证明了一件事:AI 使用量这个指标,太容易被污染。

你统计 Token,员工就会刷 Token;你统计 Prompt 数,员工就会编 Prompt;你暗示“不用 AI 就落后”,员工就会想办法证明自己没落后。

经济学里有个古德哈特定律:当一个指标变成目标,它就不再是一个好指标。

到了 AI 时代,这句话可以换一个说法:当 Token 成了 KPI,它就不再是生产力指标,而是一张会自动膨胀的云账单。以前卷工时,现在卷 Token;以前 KPI 注水,现在云账单注水。技术进步了,职场的底色一直没变。

亚马逊并不是唯一踩刹车的人。

Shopify 已经把 Token 排行榜改成更中性的使用仪表盘,加上熔断机制。Duolingo 曾经想把 AI 使用情况纳入绩效考核,后来撤回;微软 也开始收缩部分外部 AI 编程工具授权。

你的成本:老黄的资产

那些已经烧掉的钱,并不会凭空消失。一家公司的失控,往往是另一家公司的报表。

看 Anthropic,一季度收入 48 亿美元,预计二季度翻倍至 109 亿美元。这条曲线靠什么撑起来?不是普通用户闲聊,而是企业 API、Claude Code 以及无数公司内部那套“全员 AI”“Agent 先跑起来再说”的组织冲动。

图片

再看卖铲子的英伟达,最新季度收入 816 亿美元,这不只是 AI 信仰,还是实打实的现金流

现在你再看黄仁勋那句话,味道就变了。昨天他才在 GTC Taipei 上说,从产业角度看,Token 已经成为资产和营收单位。这句话聪明之处就在于,它悄悄偷换了主语。

图片

Token 的消耗,在普通企业的账本上,明明是成本,是要被财务追着问“这钱花得值不值”的支出

只有站在上游厂商的账本上,Token 才确实是资产:Token 越多,推理越多;推理越多,老黄的 GPU、网络、液冷都得跟着卖。站在 Anthropic 的账本上也是资产:企业每多跑一轮 Agent,最后都会变成它的营收和利润率

但站在下游企业的账本上,Token 首先是成本。 成本不是不能花,但只有换回更短流程、更少返工、更强交付,才有资格叫资产。如果 token 只是为了排行榜和先进性的证明来烧钱,那不过是更贵的形式主 义。

AI 提效的战场,并不在 Token 榜单

当然,这并不是要回到保守主义,否则投资 AI 的价值。问题是,很多公司把 AI 落地理解得太浅了

他们以为给员工开账号就是 AI 转型,以为使用率上去了就是组织进步,以为 Token 烧得多就是 AI 用得深。

率先投身这场“转型”的 Uber COO,分享了激进之后的醒悟:我们的代码确实多交付了一些,但很难把它和“给用户做出了更有用的功能”划上等号。

这并非个例,代码分析公司 GitClear 扒了 2.2 亿行代码,发现用 AI 辅助后,写完两周内就得返工的代码,翻了 9 倍;复制粘贴的重复代码翻了 8 倍。很多时候,企业只是把人类低效的地方,换成了模型以更贵的方式低效一遍。

图片

真正的 AI 组织提效,并不在 Token 榜单上,而发生在业务深处。企业 AI 落地最难的地方,不是给员工开账号,而是让模型穿透工作流。

这也是为什么现在 OpenAI、Anthropic 都在重金招募 Forward-Deployed Engineer(前向部署工程师),深入客户内部去拆流程、理权限、做集成—— 因为他们也已经意识到,光是 API 层面的交付,根本落不了地

图片

上游公司当然会继续讲 Token 的故事,但那毕竟是别人的增长故事。普通企业如果不先把自己的业务问题、流程结构想清楚,就急着把别人的故事搬进自己的 KPI,最后只会沦为别人财报里的配角。

你这一头的事故,就是那一头的营收。 会烧 Token 并不算本事,能说清楚“这笔钱到底让组织哪里变好了”才算。