惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

cs.AI updates on arXiv.org
cs.AI updates on arXiv.org
SecWiki News
SecWiki News
Recent Commits to openclaw:main
Recent Commits to openclaw:main
Forbes - Security
Forbes - Security
Schneier on Security
Schneier on Security
W
WeLiveSecurity
cs.CV updates on arXiv.org
cs.CV updates on arXiv.org
Google Online Security Blog
Google Online Security Blog
O
OpenAI News
Exploit-DB.com RSS Feed
Exploit-DB.com RSS Feed
S
Secure Thoughts
PCI Perspectives
PCI Perspectives
人人都是产品经理
人人都是产品经理
Blog — PlanetScale
Blog — PlanetScale
S
SegmentFault 最新的问题
Help Net Security
Help Net Security
G
GRAHAM CLULEY
Latest news
Latest news
V
Visual Studio Blog
The Cloudflare Blog
T
Troy Hunt's Blog
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
Stack Overflow Blog
Stack Overflow Blog
GbyAI
GbyAI
I
InfoQ
Know Your Adversary
Know Your Adversary
B
Blog RSS Feed
V2EX - 技术
V2EX - 技术
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
Cyber Security Advisories - MS-ISAC
Cyber Security Advisories - MS-ISAC
H
Heimdal Security Blog
Y
Y Combinator Blog
Security Archives - TechRepublic
Security Archives - TechRepublic
The GitHub Blog
The GitHub Blog
P
Palo Alto Networks Blog
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
T
Tor Project blog
T
Threat Research - Cisco Blogs
博客园 - 三生石上(FineUI控件)
Cloudbric
Cloudbric
博客园 - Franky
博客园 - 叶小钗
S
Security @ Cisco Blogs
cs.CL updates on arXiv.org
cs.CL updates on arXiv.org
阮一峰的网络日志
阮一峰的网络日志
WordPress大学
WordPress大学
T
Threatpost
MongoDB | Blog
MongoDB | Blog
V
Vulnerabilities – Threatpost
Martin Fowler
Martin Fowler

InfoQ - 促进软件开发领域知识与创新的传播

Meta 收购 Manus 这事儿泡汤了 5.5万 Star 开源项目 Ghostty 被迫出走,GitHub 正在终结一代技术人的乌托邦 Slack 长时运行多智能体系统的上下文管理方案 从 T+1 到分钟级:金城银行基于 Apache Doris 构建高可靠、强一致的实时数据平台 谷歌云推出 Agents CLI,简化 AI 智能体开发全流程 Claude官方击穿高薪、高学历的安全防线!Anthropic点名10大高危职业,但有群人暂时稳了 亚马逊云科技终止 WorkMail 服务,并将 App Runner 转入维护模式 OPPO小布记忆:全模态碎片化内容的理解与智能整理实践|AICon上海 模力工场038周AI应用周榜:工具在消失,工作流在出现 Akamai CEO Tom Leighton:Agent 时代来临,云基础设施正从“中心化”转向“分布式边缘” 日均数百亿入库背后:从“人肉调度”到K8s弹性架构,度小满金融基于OceanBase重构入库架构实践 百度文库网盘发布GenFlow 4.0:月活用户超1亿,要把网盘变成全端AI工作台 Altman 投的 Agent 终端 Warp 开源了!斩获3.5万star 哪些客户需要拒, 敢让龙虾决定吗?_AI&大模型_InfoQ 中文站_InfoQ精选视频 从开发到生产:为什么越来越多的机器学习团队纷纷迁移到 Snowflake | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 探索多智能体工作流:LangGraph Snowflake Cortex AI | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 腾讯云分布式缓存数据库:AI Agent - 从提示词工程到 Harness 工程 | 腾讯云数据库 DBTalk_腾讯_凌敏_InfoQ精选视频 基于 Streamlit 为 CSV 数据构建分析智能体 | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 AI 智能体:告别文档缺漏 | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 构建 AI 驱动的数据管道:深度探讨 Snowflake Openflow 与非结构化数据 | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 云端太贵、本地不够聪明,英特尔押注“端云混合AI”:智能体PC会替人完成工作 不到10%的存储投入,可能拖垮90%的GPU投资!IBM把AI Agent塞进存储系统,算清企业最容易忽略的一笔账 Snowpark 上手实战 | BUILD 2025_大数据_王玮_InfoQ精选视频 ClickHouse + Langfuse,构建 Agent 可观测基石 腾讯云分布式缓存数据库:Cluster Proxy 共享连接架构深度解析 | 腾讯云数据库 DBTalk_腾讯_凌敏_InfoQ精选视频 AI 写代码太烧钱了:Copilot、Claude 一起涨价,不如把程序员请回来? 英特尔发布至强600系列工作站处理器与锐炫Pro B70 GPU,全新AI工作站来了 腾讯云分布式缓存数据库:从 Redis 到 Valkey - 开源社区如何快速创新 | 腾讯云数据库 DBTalk_腾讯_凌敏_InfoQ精选视频 印奇这次要“从0重做”智驾模型!首谈阶跃和千里双公司布局:中国AI商业闭环要靠车跑出来 从Cursor返聘归来,90后华裔女高管带Claude开启日更模式:token成本比工程师工资低多了! 从 Coding 到 Agent:QCon 北京 2026 全景复盘,优秀出品人 & 明星讲师名单揭晓 全链路支撑大模型国产化“Day 0适配”,商汤大装置构建全栈能力底座 凌晨,OpenAI 与亚马逊云科技史上最大联合发布来了 HashiCorp Vault 2.0 发布:引入新身份联邦机制,迈入 IBM 生命周期体系 Yelp 实现超 1,000 个 Cassandra 节点零停机升级 写了 17 年开源代码,我为什么认为 Coding Agents 堆功能是在瞎折腾? 基于 Apache Camel 编排智能体与多模态 AI 管道 面向智能体与人类用户的AI记忆系统:架构设计与核心场景实践|AICon上海 Anthropic 推出 Managed Agents,简化 AI 代理部署流程 阿里HappyHorse开启灰测,720P视频生成低至0.44元/秒 讯飞联合清华团队押注量子AI:不看营收、不设KPI,一群“无人区”科学家,抢夺下代AI算力入口 小米万亿模型全面开源:MIT 协议、1M 上下文,但还是打不过 DeepSeek Cortex Code 入门指南:面向数据工程师的实践路径 | 技术实践 openJiuwen社区首发Team Skills,定义Coordination Engineering新范式 用 Snowflake Cortex Agents 释放结构化数据的最大价值 | 技术实践 Grafana 利用 Kafka 对 Loki 进行了架构重构,并发布了一款命令行工具,旨在将可观测性引入编码代理 ClickHouse重构全文索引:对象存储上跑出高性能 Full-Text Search 可观测性和遥测技术如何提升软件工程实践 Dropbox 与 GitHub 合作,将单体库大小从 87GB 缩减至 20GB Agent 的下一站:基于长期记忆系统 EverOS 的自我演进|AICon上海 同一赛道,四种收费:Agent 控制层(Harness)开始分裂 Cloudflare Sandboxes 正式发布,为 AI 代理提供持久化隔离环境 Agent 的“记忆断片”困局,该怎么破?_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选视频 数据分析师如何快速建立在 AI 时代最值钱的能力:一份可落地的行动路线图 摩尔线程最新财报:研发占比超86%,万卡级大规模智算集群落地 当云区域失效:地缘动荡环境下的高可用重构 Slack 重构通知系统,设置参与度提升 5 倍 智能体工程的隐性技术债务 “我把所有模型都换成了DeepSeek V4”:月账单将降 90%,效果还更好 阿里云智能集团高级技术专家刘少伟已确认出席AICon上海站,并分享如何构建企业 Agent 的自动化行动架构 构建生产就绪的 tRPC API:Apollo Federation 的 TypeScript 替代方案 Anthropic推出面向Claude Code的基于智能体的代码审查功能 北京车展直击:斑马智能甩出车载Agent短剧,比亚迪率先落地,AI让智能座舱又热起来了 Snowflake 作为智能体运行时:从静态管道迈向自主数据系统 | 技术实践 Snowflake 上的本体体系:基于 Cortex Code 能力实现从架构到部署 | 技术实践 Cloudflare 公布 MCP 架构方案,应对企业面临的安全与治理风险 复杂的项目管理怎么做到「AI 友好」?飞书项目用「开放」给出答案 Snowflake Cortex Code 的规范驱动开发:将 SDLC 方法论引入 AI 辅助工作流 | 技术实践 Copilot 不让注册了:从“随便用”到“全面限”,agent 把原有订价模型顶穿了 当互联网用AI卷效率时,这家公司先问了一连串“能不能” Meta 开始记录员工每一次点击:AI 要接管工作,先监控会工作的人 Meta“Token榜”逼疯打工人,一夜烧掉公司几万刀!AI时代Token焦虑越来越离谱 智源FlagOS完成DeepSeek-V4-Flash在八款芯片Day0适配,实现三重技术突破 DeepSeek V4 重磅开源!首次打通华为Ascend,也没丢掉英伟达,百万上下文夺回国产模型话语权 李志飞的“新实验”:当超级个体撞上真实组织 GPT-5.5 登顶时刻,Anthropic 亲口承认 Claude 变笨了!网友群嘲:太敷衍 那些没空写的小需求,龙虾真能做吗?_AI&大模型_InfoQ 中文站_InfoQ精选视频 从 Pandas 到生产:使用任意 IDE 进行可扩展的 ML 数据管道与分布式处理 | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 pnpm 11 候选版本发布,带来 ESM 分发、供应链默认设置以及新的存储格式 银行业PDF表格提取方案重构:基于Java的分层方案 GPT-5.5 赢了 Opus 4.7 和 Mythos?奥特曼晒黄仁勋内部信:英伟达全员用上 Codex! Cloudflare 推出 Think:一款面向 AI 代理的持久化运行时 1850亿美元天价支出、75%代码由AI生成!谷歌正式宣告:全面转向智能体工作流 xAI落后太多,马斯克“开大”重金求购Cursor,100亿美金“分手费”都敢签! Pulumi 新增对 Bun 运行时的全面支持 姚顺雨腾讯模型首秀!不卷参数只做 “听话打工人”,Hy3 preview登场 | 附实测 老板让你“忽悠”投资人,你敢发给龙虾吗?_AI&大模型_InfoQ 中文站_InfoQ精选视频 Gemini CLI 引入子代理机制,实现任务委派与并行代理工作流 清华系团队星工聚将完成数千万天使轮融资,轮式机器人拿下头部制造企业亿级大单 Pretext.js 绕过 DOM 布局重排,实现 120 FPS 的高级交互体验 靠“AI 云”爆红的 Vercel,栽在一个第三方AI工具手里!IPO前夕遭黑,200万美元赎金谈崩? 高能研讨会|端侧 AI 正在重写实时感知效率上限_AI&大模型_王玮_InfoQ精选视频 2050大会看这篇就够了|报名、交通食宿指引大全 Java 近期资讯:OpenJDK JEP、Jakarta EE 12、Spring Framework、Micrometer、Camel、JBang 金融智能的架构编排:基于 Snowflake Cortex Agents 实现结构化与非结构化数据统一分析 | 技术实践 在AK大神爆火的任务里,摸清国产AI真实水平 百灵Ling-2.6-flash 正式发布:高 Token 效率,以 1/10 消耗实现 SOTA 级 Agent 能力 当 PM 懂AI,当技术懂产品:AI 时代产品力的双向进化|PM x AI产品力领航者大会即将开幕 为 AI 智能体设计记忆机制:揭秘 LinkedIn 的认知记忆智能体 获奖名单公布|2026主题征文第一期|分享你最有价值的龙虾场景与核心 Skill_热门活动_InfoQ写作社区官方_InfoQ写作社区
Fable 5被禁3天后Anthropic认怂!连夜急派员工赴华盛顿谈判:GPT 5.5有同款漏洞
华卫 · 2026-06-17 · via InfoQ - 促进软件开发领域知识与创新的传播

整理 | 华卫

作为 Anthropic 有史以来向公众发布的最强 AI 模型,Fable 5 仅“上线”了短短三天。它在聊天机器人竞技场排行榜上登顶,在编程基准测试中以两位数的优势碾压 OpenAI 的 GPT 5.5,并首次让付费订阅者接触到 Mythos 级别的推理能力。然后,在 6 月 12 日,特朗普政府下令 Anthropic 将其下架。

Anthropic 公开辩称该指令是不相称的,所引用的漏洞并不能证明完全撤下该模型是合理的。当前,Fable 5 能否回归取决于 Anthropic 与政府就出口管制分类进行的谈判。

最新进展:Anthropic 派遣员工谈判中

昨日,据外媒报道,Anthropic 的一位知情人士透露,在白宫命令实质上迫使 Anthropic 的旗舰产品下线后,该公司高级成员正在华盛顿特区与特朗普政府努力达成协议。报道还指出,特朗普政府对 Anthropic 处理越狱投诉的方式感到不满,声称 Anthropic 并未“以严肃的态度进行沟通”。

但知情人士透露,自白宫上周五首次主动联系以来,Anthropic 的技术人员已与白宫官员举行了虚拟会议。双方的消息人士均表示,他们渴望解决这个问题。

此外,究竟是何原因导致 Anthropic 模型下架,当前还有多重消息。亚马逊似乎正是向白宫指出 Anthropic 的 Fable 5 和 Mythos 5 模型存在所谓潜在安全漏洞的公司之一。此前外媒的报道称,上周四晚至周五上午,亚马逊与其他五家公司通知白宫,它们已成功演示了那种令人担忧的越狱操作,其 CEO 安迪·贾西已就此与特朗普政府成员进行了接触。

根据 Semafor 另一则援引匿名消息源的报道,白宫还担忧“一个与中国有关的组织”已获得了一个 Mythos 级模型的访问权限。Semafor 指出,Anthropic 不允许来自中国的用户访问其 AI 模型。

对此,亚马逊的一位发言人表示:“政府就潜在安全风险向我们咨询并不罕见。当这种情况发生时,我们不会透露这些讨论的细节。”Anthropic 的一位发言人表示,白宫在围绕 Fable 越狱和出口管制进行的对话中,并未提及中国访问 Mythos 的问题,这家 AI 公司禁止来自中国境内访问其产品。

白宫公开态度:解决安全问题、Fable 重新向大众发布

据了解,Fable 5 和 Mythos 5 是所谓的“Mythos 级”模型,它们基于与 Claude Mythos Preview 相同的核心技术构建,是付费 Claude 账户用户可访问的公开产品。Fable 5 于 6 月 9 日发布,是 Anthropic 首款向公众开放的 Mythos 级别模型。它提供了一百万 token 的上下文窗口和 128000 个输出 token。Anthropic 原定向 Pro、Max、Team 和 Enterprise 订阅者免费提供该模型至 6 月 22 日,但这个促销窗口被政府指令在仅三天后就缩短了。

Mythos Preview 是 Anthropic 在 4 月发布的模型,当时该公司声称该模型过于强大,因极易被滥用可能危及全球网络安全,并存在其他所谓的危险,故而采取了严格的发布控制,仅限少数几家特定公司使用,不予发布。被下架的 Fable 5 和 Mythos 5 模型,本应是 Mythos Preview 的“驯化版”,通过广泛且显性的护栏措施使其安全。

上周五下午,Anthropic 接到了白宫的电话,告知其让 Fable 5 和 Mythos 5 继续在线构成了一项未具体说明的“国家安全威胁”,并要求公司在 90 分钟内关闭它们。目前尚不清楚接下来的几个小时内发生了什么,但不久后,出口管制令显然通过一封信件送达 Anthropic:要求 Anthropic 不得允许非美国公民使用其最顶尖的先进 AI 模型产品。

这意味着,即使是 Anthropic 的外籍员工也禁止使用这些模型。特朗普政府援引一个越狱漏洞作为撤下 Fable 5 及更广泛的 Mythos 5 模型系列的理由。数小时后,这些模型便下线了。

6 月 14 日,特朗普的顾问 David Sacks 在 X 平台上发帖,为白宫决定实施出口管制的前因后果提供了新的信息。据 Sacks 指控,一个与 Anthropic 和白宫都有合作、且高度可信的合作伙伴在测试 Fable 时,发现了针对其的越狱方法。当特朗普政府将越狱情况告知 Anthropic 时,Anthropic 联合创始人兼 CEO Dario Amodei 表示该越狱并非严重风险,并拒绝修复。

推文中写道,“过去,Anthropic 一直强调安全必须是首要任务,并且非常认真地对待安全。但在这次事件中,Anthropic 将消费模型的持续提供置于安全之上。白宫现在的希望是:Anthropic 解决安全问题,出口管制令被解除,Fable 重新向大众发布。”

这并非 Anthropic 首次与白宫发生冲突。该公司曾游说反对特朗普政府抢先制定州级 AI 监管法规,并且因在将其模型用于自主武器问题上陷入僵局,正在起诉五角大楼。Sacks 表示,先前的这些冲突并未影响政府对 Mythos 的决定。“那些试图转移话题、将这一行动与之前事件联系起来的人是错误的。白宫重视 Anthropic 的技术能力,并认为这个问题虽然严重,但应该能够轻松解决。”

被“全面超越”的 GPT 5.5,也有相同漏洞?

对于白宫调查结果的严重性,Anthropic 此前明确公开提出异议,称所识别的漏洞是微小的、公开已知的,并且 GPT 5.5 无需任何越狱技术即可实现。

“我们审查了该特定技术的演示,该技术被用于识别少量此前已知的、微小的漏洞。这些漏洞似乎都相对简单,我们发现其他公开可用的模型也能够在无需越狱的情况下发现它们。”Anthropic 在 6 月 12 日的声明中指出。他们表示,公司为 Fable 建立了强大的安全护栏,大大减少了 Fable 被用于网络安全相关任务(以及其他)的可能性,以至于许多用户抱怨其过于宽泛。

Anthropic 还称,特朗普政府仅向他们提供了口头证据,证明存在一种潜在的、狭窄的非通用越狱,本质上就是要求模型读取特定的代码库并修复任何软件缺陷。他们审查了一份可能是政府指令依据的报告,并已证实报告中所展示的能力水平在其他模型(包括 OpenAI 的 GPT-5.5)中广泛存在,并且每天都被维护系统安全的安全防御者所使用。

而当前这场风波带来的实际后果之一是,那些正在评估 Fable 5 以用于生产环境的开发者和研究人员不得不退回到 GPT 5.5 或 Anthropic 早期的 Opus 模型。

据了解,Fable 5 与 GPT 5.5 两个模型之间的基准差距并不小。在衡量模型解决开源代码库中真实软件工程问题能力的 SWE-Bench Pro 上,Fable 5 得分 80.3%,而 GPT 5.5 为 58.6%,相差 22 个百分点。在同一基准的精调子集 SWE-Bench Verified 上,Fable 5 达到了 95.0%。对于编码密集型工作流来说,这种降级是显著的。SWE-Bench Pro 上 22 个百分点的差距,代表着一个能解决五分之四真实软件问题的模型与一个能处理大约五分之三问题的模型之间的区别。

编程基准测试也展现了类似的差距。Fable 5 在 Code Arena 上领先 98 个 Elo 分,得分为 1665,而 GPT 5.5 为 1501。在旨在测试最具挑战性编程任务的 FrontierCode Diamond 基准上,Fable 5 得分 29.3%,而 GPT 5.5 仅为 5.7%。在更广泛的聊天机器人竞技场排行榜上,Fable 5 位居第一,GPT 5.5 位列第四。

GPT 5.5 也有优势领域。在评估交互式终端编码任务(而非代码库级别的问题解决)的 Terminal-Bench 2.0 上,GPT 5.5 得分为 82.7%,而 Fable 5 约为 88.0%。这里的差距较小,而且该基准测试的技能不同:实时执行命令和调试,而不是阅读和修补大型代码库。此外,GPT 5.5 每百万输入 token 收费 5 美元,每百万输出 token 收费 30 美元,是 Fable 5 定价(分别为 10 美元和 50 美元)的一半。对于运行高容量应用、且性能差异不如成本关键的开发者而言,即使两种模型都可用,GPT 5.5 是更实际的选择。

参考链接:

https://thenextweb.com/news/anthropic-fable-5-vs-openai-gpt-5-5-benchmark-comparison

https://www.semafor.com/article/06/13/2026/white-house-move-to-limit-anthropic-linked-to-concerns-about-chinese-access-to-mythos