惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

小众软件
小众软件
N
News and Events Feed by Topic
A
About on SuperTechFans
aimingoo的专栏
aimingoo的专栏
The Cloudflare Blog
H
Heimdal Security Blog
Schneier on Security
Schneier on Security
Engineering at Meta
Engineering at Meta
Google Online Security Blog
Google Online Security Blog
宝玉的分享
宝玉的分享
AI
AI
The GitHub Blog
The GitHub Blog
MongoDB | Blog
MongoDB | Blog
www.infosecurity-magazine.com
www.infosecurity-magazine.com
The Last Watchdog
The Last Watchdog
T
Troy Hunt's Blog
S
Security @ Cisco Blogs
H
Hacker News: Front Page
F
Fortinet All Blogs
博客园_首页
S
Secure Thoughts
N
News and Events Feed by Topic
P
Proofpoint News Feed
Microsoft Azure Blog
Microsoft Azure Blog
I
InfoQ
Spread Privacy
Spread Privacy
Hacker News - Newest:
Hacker News - Newest: "LLM"
cs.CL updates on arXiv.org
cs.CL updates on arXiv.org
C
Check Point Blog
Hugging Face - Blog
Hugging Face - Blog
Hacker News: Ask HN
Hacker News: Ask HN
C
CXSECURITY Database RSS Feed - CXSecurity.com
酷 壳 – CoolShell
酷 壳 – CoolShell
Stack Overflow Blog
Stack Overflow Blog
L
LINUX DO - 最新话题
Exploit-DB.com RSS Feed
Exploit-DB.com RSS Feed
S
Schneier on Security
Know Your Adversary
Know Your Adversary
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
Scott Helme
Scott Helme
P
Privacy & Cybersecurity Law Blog
S
Securelist
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
O
OpenAI News
K
KPMG report finds enterprise disconnect between AI and its ROI | CIO
PCI Perspectives
PCI Perspectives
L
LangChain Blog
雷峰网
雷峰网
Security Archives - TechRepublic
Security Archives - TechRepublic
V2EX - 技术
V2EX - 技术

雷峰网

1.8亿人在小红书读书:图书业在小红书电商营收规模年增超30% | 雷峰网 减重300kg,首搭5nm智驾芯片:2026款乐道L90正式亮相 | 雷峰网 阶跃和千⾥科技官宣战略合作:打造原⽣智驾基座模型,提升物理AI能⼒上限 | 雷峰网 “还债骑手”被强制下线240次:“开始我很反感过劳提醒,影响赚钱” | 雷峰网 石头科技:2025年营收高增56.51%,2026Q1营收增23.31% | 雷峰网 Mythos引爆攻击工业化时代,奇安信:构建三位一体内生安全体系是破解之道 | 雷峰网 曝两家科技大厂争投DeepSeek,估值飙至200亿美元;小米深夜放大招!最强大模型MiMo-V2.5系列发布;微软 Xbox 部门将裁员15% | 雷峰网 RGB-Mini LED电视普及风暴,海信正式发布小墨E5S Pro | 雷峰网 标配8255芯片与CDC,奇瑞试图终结“燃油车无智驾”时代 | 雷峰网 德赛西威也不相信,智驾能让Tier1躺着赚钱 | 雷峰网 找来刘翔做代言人,可能是智己LS8最好的一步棋 | 雷峰网 「中国版Grok上车」分水岭:阶跃交出首份量产答卷 | 雷峰网 百度Create大会双主论坛议程揭晓,多项重磅升级发布将集中亮相 | 雷峰网 泄露用户隐私!曝某AI助手将B用户简历发给A用户;苹果更换CEO原因曝光;微信宣布5国可用微信支付;航旅纵横「崩」了一天,借钱功能却正常 | 雷峰网 一季度交付1200件精益工具,希音深入技术创新提升按需时尚竞争力 | 雷峰网 从“替代”到“重构”:联想开天“1+2+N”如何重写信创AI PC逻辑? | 雷峰网 中山大学郭裕兰团队:数据充足却训练失败,多智能体到底卡在哪丨CVPR 2026 | 雷峰网 上交大 x vivo 团队:一个简单改动,让 diffusion 全面提升丨CVPR 2026 死亡率「99%」的芯片创业淘汰赛,为旌科技为何能活下来? | 雷峰网 清华段岳圻团队论文:从调参数到做控制,文生图迎来一次方法论升级丨CVPR 2026 | 雷峰网 东南大学耿新团队:模型不是不会做,而是被「挤掉了能力」丨CVPR 2026 | 雷峰网 西湖大学张驰团队:不重训,也能让视频生成更长更稳丨CVPR 2026 | 雷峰网 西湖大学张驰团队:从视觉合成到空间理解,视频 AI 正在「转向」丨CVPR 2026 | 雷峰网 21.0975 公里,是人形机器人的里程碑,也是 RISC-V 的新起点 | 雷峰网 独家 | 华为19级天才少年赵立晨离职创业,瞄准具身 Agentic OS 独家 | CMU系⼜诞⽣⼀家具⾝智能公司「Zeno AI」 | 雷峰网 Token消耗量翻10倍才算企业转型及格线?三位产业一线大佬教你用出性价比 | 雷峰网 阿里发布Qwen3.6-Max预览版,登顶最佳国产模型 | 雷峰网 郭达雅加入巨头背后:顶尖AI人才为何向大厂「回流」? | 雷峰网 解决机器人散热困境,华科冷芯高速悬浮泵液冷方案助力荣耀人形机器人“闪电”夺冠 | 雷峰网 智元邓泰华宣布:具身智能行业进入「部署态」 | 雷峰网 独家丨前安克研发总监丁准离职创业,获头部美元基金押注 | 雷峰网 曝DeepSeek V4将于本周发布,梁文锋对外融资20亿;雷军在服务区被堵车里维权?小米徐洁云回应;宇树H1半马被担架抬离赛道丨雷峰早报 | 雷峰网 广州一斗虾赛现场各路选手比拼蒸馏,现场诞生近50个“技能包” | 雷峰网 智元 ×Hitch Open|深耕具身智能,共建全球物理智能学术生态 | 雷峰网 2026广汽科技日重磅发布五大核心技术,以“科技向心”引领智能出行时代 | 雷峰网 一汽大众与卓驭科技的七年协同,交出一份燃油车智能化的成绩单 | 雷峰网 腾讯的长青游戏,今天又进化了一次 | 雷峰网 智己LS8上市:24.98万起售,刘翔站台的这台「最强8系」能打吗? | 雷峰网 全球1100万台出货,追觅打造最聪明的扫地机 | 雷峰网 阶跃率先跑通“中国版 Grok 上车”量产交付!超级 Eva 搭载极氪8X 今起上市 物理AI时代,为什么需要一颗“舱驾融合”芯片? | 雷峰网 逸安启欢迎问界加入,与宝马、梅赛德斯-奔驰携手, 共同推进中国豪华超充网络的发展 | 雷峰网 逐际动力开源 FluxVLA Engine:专为具身智能打造的标准化VLA工程底座 | 雷峰网 独家丨AWS大中华区多位L8高管迎来变动,SA部门负责人代闻离职 | 雷峰网 头部品牌 “加码”东南亚 泡泡玛特新品在Lazada发售 | 雷峰网 D19起售价21.98万元,零跑能成为9系SUV的“破局者”吗? | 雷峰网 全球首款!进迭时空 RISC-V AI CPU K3 成功适配 OpenHarmony 6.1 4小时闭门会,15位运动科技创业者聊透了哪些「不能公开说」的真相 | 雷峰网 在女性黑客松上,看见AI硬件的另一种可能 | 雷峰网 Plaud 爆火后,YoooClaw 要改写 AI 硬件的剧本 黄仁勋:DeepSeek在华为芯片上发布「很可怕」;抖音集团副总裁辟谣郭达雅亿元年薪入职字节;五角大楼与通用、福特等汽车制造商讨论造军火 | 雷峰网 正式官宣!佑驾创新与荣耀(HONOR)达成合作,以“无人车+机器人”打通全链路无人化闭环 | 雷峰网 解耦性能与厚重,英特尔AI高静Plus正在重写游戏本定义 | 雷峰网 独家丨Somnia Lab 完成千万美元天使轮融资,瞄准人机关系入口与万亿级具身情感生态 | 雷峰网 腾讯发布并开源混元世界模型 2.0,一句话造出3D世界,兼容游戏引擎! | 雷峰网 阿里发布世界模型HappyOyster,与谷歌Genie3竞争 | 雷峰网 从「集体暴跌」到「双轨分化」:一篇论文误读如何撕开DDR真实行情? | 雷峰网 格力高管炮轰友商被狂怼:又当又立!「真铜实料」这四字不姓格;美国将退还超1万亿元关税;品牌GMV高速增长,速卖通将成品牌出海全新主场 | 雷峰网 全球线上首发!辉瑞新一代减重药先维盈®开启预售服务,美团买药又下一城 | 雷峰网 傲基「生死局」:绝地反杀与盈利迷途 | 雷峰网 阿里ATH发布AI开发工具Meoo,已打通阿里云核心产品 | 雷峰网 美团闪购升级闪电仓供应链服务平台:向全行业商家开放即时零售供应链基建 | 雷峰网 阿里云连续5年稳居游戏云市场份额第一! | 雷峰网 与阿里成立合资公司后,新世界旗下Gmarket商品交易额(GMV)实现双位数增长 | 雷峰网 度小满发布DXMClawPay 面向Skill开发者提供一站式支付接入方案 | 雷峰网 滴滴自动驾驶全球化布局加快,年内在阿联酋开展试点 | 雷峰网 金立创始人刘立荣消失8年后最新动向:疑在印尼卖家具;月薪3万,DeepSeek聘人去内蒙草原守机房;比亚迪坪山园区大火,公司回应火势已扑灭 | 雷峰网 水下绞杀:清洁机器人渠道里的生意与生死 | 雷峰网 墨腾报告:东南亚电商平台成交额五年翻三倍 三大平台瓜分万亿市场 | 雷峰网 火山引擎:Seedance 2.0 API 服务全面开放 | 雷峰网 中远海运特运X火山引擎:“数字员工”驶向智慧航运新蓝海 | 雷峰网 重新认识具身行业,从自变量的这封邀请函开始 | 雷峰网 做了5年3D打印机,我发现了世界模型的Scaling Law | 雷峰网 别克×火山引擎:至境E7行业首发搭载豆包大模型最新版 | 雷峰网 强强联手,追觅牵手阿里速卖通,将在海外加大投入 | 雷峰网 推理卡毛利率下滑超7%,天数智芯「降价换量」的买卖值不值? | 雷峰网 明日新程完成连续两轮融资,领跑Harness群体多智能体赛道 | 雷峰网 「作弊」内幕曝光!3DMark回应将某知名国产手机除名;李想朋友圈炮轰东风日产恶意拉踩,后者高管回应;美的空调又发行业首创产品 | 雷峰网 50万起步的蔚来ES9,能否站稳高端? | 雷峰网 汽车行业已在阿里云上使用超10万卡“真武”PPU研发智驾 | 雷峰网 百度智能云联合多家头部具身智能企业,打造具身智能数据超市 | 雷峰网 从汽车到物理 AI:何小鹏眼中的智能汽车下半场 | 雷峰网 首个跑通端到端闭环的全模态安全脱敏的龙虾盒子,无问芯穹InfiniClaw Box让本地龙虾也能放心用! | 雷峰网 当参数不再决定胜负,AI时代的企业级SSD靠什么「赢」?|MemoryS 2026 | 雷峰网 独家丨继大疆押注后,智能派再获数亿元融资,或与拓竹正面硬刚 | 雷峰网 阿里视频生成大模型Wan2.7登顶DesignArena榜单 | 雷峰网 KV Cache需求暴涨32倍,AI如何重写存储产业链的「旧分工」?| MemoryS 2026观察 | 雷峰网 微软小冰,生不逢时 | 雷峰网 豆包APP实时语音通话升级全双工模型 抗干扰与低时延能力提升 | 雷峰网 中国充电联盟与万勋科技联合发布《中国新能源汽车自动充电用户行为洞察报告》加速自动充电规模商用 | 雷峰网 继“同事.skill”走红,周鸿祎回应“把自己炼成AI分身”:这才是数字分身的正确未来 | 雷峰网 章鱼动力获得新加坡顶级风投 K3领投的数亿元投资 | 雷峰网 港中文薛天帆团队:实现 4K 全景视频生成,普通视频也能「长出空间」丨CVPR 2026 | 雷峰网 独家丨前大疆T4悍将谢博文:从具身机器人转战桌面CNC,深圳再启「无限工坊」 | 雷峰网 2026淘宝直播三大主线:提效新品,造优质主播差异化,增优质内容曝光 | 雷峰网 阿里云百炼上线Agent记忆库,让「龙虾」应用更懂用户 | 雷峰网 百度官宣!Create2026百度AI开发者大会定档5月13至14日 | 雷峰网 印度禁止中国大陆产摄像头监控:花高价大批替换,国产厂商回应;传宇树科技与阿里达成出海战略合作;DeepSeek上线专家模式 | 雷峰网 20分钟破1000万!首日破3000万!创想三维2026全球3D打印类目众筹王者!AI+生态双向助推,3D打印布道者重新定义3D打印生态! | 雷峰网
Fable 5 刚被封杀,OpenRouter 用「多模型协作」搞出了「平替天团」 | 雷峰网
2026-06-22 · via 雷峰网
Fable 5 刚被封杀,OpenRouter 用「多模型协作」搞出了「平替天团」
 最强 AI 突遭封杀下架,多模型协作能否填补空白?

    作者丨高允毅

    编辑丨马晓宁

当世界上最聪明的 AI 被强制拔掉网线,我们能否有另一套方案,用上同样聪明的智力?

2026年6月14日,全球最大的大模型 API 聚合平台OpenRouter,在 X 上发布一条推文,短短几天,吸引近600万人围观。

Fable 5 刚被封杀,OpenRouter 用「多模型协作」搞出了「平替天团」

该平台宣布推出了世界上最聪明的“复合模型”Fusion API ,能用模型组合的方式,复刻 Claude Fable 5 的智力水平。 所谓“复合模型”,不是靠一个 AI 自己埋头苦干,而是让好多 AI 模型一块儿配合,做出一份最好的答案,再交给用户,对外统一用一个API 入口。

Fusion API 的横空出世,踩中了一个微妙的时机。 就在同一周,Anthropic 刚发布了 史上最强模型Claude Fable 5。该模型以强悍的长周期智能体推理出圈,能将企业原本需要数月的代码迁移工作缩短至一天。

然而,发布仅 3 天,美国政府便签发了紧急出口管制令。Anthropic 官方被迫切断全球网络,暂停该模型的 API 访问,原本跃跃欲试的开发者们,瞬间哀嚎遍野。

OpenRouter这条推文,正是精准地踩在了市场真空期的最痛点,同时给出一套新方案:与其押注单一模型,不如让一群模型"开会"。

它公布了一组惊人数据:在深度研究中,由 Gemini 3 Flash、Kimi K2.6 和 DeepSeek V4 Pro 组成的“模型专家团”,融合后不仅轻松击败了 Opus 4.8,其综合智力与被禁的 Fable 5 相比,得分误差不到 1%。(注:Claude Fable 5 因内容过滤仅完成 DRACO 100 道任务中的 93 道,中端模型组合完整跑完全部 100 题,二者评测样本存在差异。)

而实现这一切的调用成本,仅仅是 Fable 5 的一半。

Fable 5 刚被封杀,OpenRouter 用「多模型协作」搞出了「平替天团」

01


Fusion API背后的“多模型拼盘”

OpenRouter 将 Fusion 冠以“市场上最智能复合模型”的称号,确实带有营销色彩。

从底层来看,它的原理是将“多模型并行、裁判海选、终审合成”三步走流程化、标准化的工程解法。

第一步:专家团模型的“头脑风暴” 首先,用户的提示词一经触发,系统会将其同时派发给最多8 个“专家模型”,包括Fable 5、GPT-5.5、Gemini 3.1 Pro以及国产好评的GLM-5.2、Kimi K2.6等众多模型。 值得注意的是,为了防止模型“闭门造车”,系统在底层为所有专家统一配备了实时联网搜索与网页内容抓取工具。这意味着,专家模型们在交卷前,可以查阅全网最新的参考资料。这种实时交互,让 Fusion 彻底区别于简单的“少数服从多数”的盲目投票。

第二步:裁判模型来挑刺 这是 Fusion 的灵魂所在。一个被指定当“裁判”的模型,会把所有专家的回答看一遍,然后写出一份细致的分析报告。它会特别严格地把这些回答里的意见一致的地方、 互相矛盾的地方、特别出彩的个人见解,还有大家都没注意到的盲点,一条条都揪出来。

第三步:主笔模型最后定稿 裁判的报告出来之后, 一个主笔模型就上场了。它会吸收所有专家的优点,排除掉个别模型瞎编的东西,最后产出一份没有技术矛盾、逻辑顺畅的高质量回答。

在这里,OpenRouter 展现了一个很聪明的工程设计:为了避免多次调用导致系统延迟全面崩塌,它巧妙地让“裁判”与“主笔”两件事,放在同一个超级大模型的一次思考里一口气完成。那些复杂的开会、辩论、审计、整合,全都在后台悄悄做完了,用户最终只是一个干干净净的结果。

Fusion的这套思路,其实在学术界早有探索。2024年,Together AI 团队正式提出的一种多模型协同技术范式,又称MoA。

它的核心逻辑是“三个臭皮匠,顶个诸葛亮”,不再死磕一个超级贵、超级大的单个模型,而是分好几层,让一组便宜些的模型同时想,再让一个高级模型当评委,最后出来的答案,反而比任何单个模型都强。 在 MoA 正式提出之前,学界长期争论一个猜想:把好多比较弱的模型凑在一起,

能不能出现比最强模型还好的集体智慧? 于是就有了这种让 AI 组团辩论的方法。

从很早将工具与模型缝合的复合 AI 系统,到 2023 年把多个模型的输出直接糅合的工具,再到 2024 年谷歌让多个智能体像开会一样辩论的论文,学术界早已论证了同一件事:组合拳的输出远比单打独斗更具确定性。

Fusion 的核心价值在于它是行业首个将完整 “多模型合议” 流程标准化、托管化、开箱即用的商用 API 产品。 它把一整套复杂架构变成了一项可以托管的、即插即用的 API,无需任何基础设施。开发者不用自己再去搭服务器、调参数。只要改一行代码,就能直接指挥一整个专家团。

在真正落地的过程里,OpenRouter 表现得很务实,主要体现在两个机制上:

  • 第一,给用户完全透明的控制权:你可以自己决定让哪些模型当评审,让哪个模型当最后的主裁判。如果国外的服务不好用,你还能让咱们的国产大模型挑大梁。甚至可以给不同模型分配重要程度,让整个合作网完全听你指挥。

  • 第二,极具灵巧性的“动态智能门控”:这个功能像一个工具箱里的小插件。平时问点简单的问题,系统会自动识别,直接让一个便宜的模型秒回,根本不启动复杂的开会流程。只有碰到特别难、需要深思熟虑的问题时,才会把一群模型叫起来,一起商量。

Fable 5 刚被封杀,OpenRouter 用「多模型协作」搞出了「平替天团」

02


在DRACO基准测试中的“聪明”表现

Fusion这套“组队干活”的聪明效果,在 Perplexity AI 发布的权威深度研究基准测试 DRACO 中得到了直接印证。

作为一个专门测试 AI 深度研究能力的硬核考场,DRACO 包含了法律、金融、医学等 10 个领域的 100 道复杂任务。

它的规则极其严苛,采用“负分淘汰制”,每道题约有39 个判定标准进行全方位“挑刺”,回答错误或硬凑字数,都会被扣分。为了防止运气成分,每个回答要找三个不同的裁判,各看一次,最后取一个稳定的平均分。

Fable 5 刚被封杀,OpenRouter 用「多模型协作」搞出了「平替天团」

在DRACO的真实评测中,可以看到一些有趣的信息:

总榜排在最前列的几乎清一色是“组合模型”,其实际效果把排在后方的单体模型远远甩在了身后

“自己和自己组队”也能变强:利用 Fusion 机制,即便是相同的模型融合,也能实现超越前沿的性能。比如两个Claude Opus 4.8 互相融合,其最终的得分不仅远超自己,甚至直接超越了Fable 5。

最有趣的是,哪怕不用昂贵的顶级模型,用中端模型组队同样能逼近天花板。由 Gemini 3 Flash、Kimi K2.6 和 DeepSeek V4 Pro 组成的“平民专家队”,在经过 Fusion组合后,以不到 1% 的微弱得分差距,正面直逼 Fable 5。 当然,最强的模型组合依然来自最强模型的强强联手,Fable 5+GPT-5.5霸榜第一。

Fable 5 刚被封杀,OpenRouter 用「多模型协作」搞出了「平替天团」

但需要注意的是,DRACO只考察“纯文字、纯英文”的深度研究能力,不包含长周期动态任务、代码运行、多模态与非英文场景。这种固定的测评体系,无法考察将来实际用起来是什么样;而且分数多少,也跟找谁来当裁判有很大关系,不同的评委大模型,绝对分数会产生 10 到 25 分的巨大波动,但相对系统排名保持稳定。

简而言之,Fusion的绝对优势,主要在研究复杂问题,把很多信息揉在一起, 写出一份的高质量深度报告这件事上。

Fable 5 刚被封杀,OpenRouter 用「多模型协作」搞出了「平替天团」

03

最吸引人的经济账:真的只要一半吗?

Fusion最受人们关注的是莫过于那句口号:只用一半的价格,达到Fable 5的智力效果。

众所周知,Claude Fable 5 的价格堪称昂贵,其输入每百万 Token 为 10 美元,输出每百万 Token 达 50 美元。这一价格正好是前代旗舰 Claude Opus 4.8 的两倍,也是目前市场上最昂贵的前沿大模型之一。

如果真的能省下一半成本,开发者们自然趋之若鹜。但 Fusion 这笔账到底是怎么算的?

Fusion 的收费规则是“你调用了几个模型就得付几个模型的钱。”,这意味着一条提示词如果被路由分配到 4 个模型,用户就要付 4 次钱。这让很多开发者直呼“太贵了”。

那为什么它最终还能省钱?秘密在于 Token 价格的极端不对称性:大模型的输入成本通常极其廉价,而长篇大论的输出成本却极其高昂。

Fusion 省钱的本质,就是“多花好几份极便宜的输入费”,去避开那个“最贵最贵的输出费”。

以4个模型为例,虽然4 个模型的输入都需要付钱,但只付了 4 次很便宜的输入费,但最终答案,只有一个模型输出。所以真正花大钱的地方,只有一份。

如果配合前文提到的“动态智能门控”,这笔账还会更划算。

当公司大规模跑业务的时候,90% 的简单问题,可以自动分给便宜又好用的模型了。  只有那 10% 超级难的、触及能力上限的问题,才会启动 Fusion 开会。这样算下来,整体成本可能比“全部用昂贵模型”还要低。

而真正让 OpenRouter 敢喊出“成本减半”的终极底气,来自于它有一个功能叫“提示词缓存”。

当你要处理的文本特别长,或者系统指令里有一大段固定不变的东西,哪怕输入再便宜,一旦要让 4 个甚至 8 个模型都看一遍,总价还是很吓人的。

但 Fusion 聪明就聪明在,多个专家模型可以同时用同一份缓存好的数据。除了第一次要付全价,后面再读同样的东西,就只要付一顿几乎可以忽略的零头,大概只有原价的 10% 到 20%。

如果没有提示词缓存这项技术托底,多模型辩论就只是一个“开着豪车送外卖”的工程乌托邦。

把账算清楚之后,企业做技术的人就能清楚知道Fusion的使用边界,什么场景能省钱,什么场景会破产?

当你遇到了一个超级难题,单凭任何一个模型都搞不定,你原本只能咬牙花大价钱用最牛的那个。现在你用 4 个中等模型组队,加上缓存,总账单确实能比天价模型便宜一大截。

反而会更贵的场景是:如果你的日常工作,本来一个便宜模型就能轻松搞定,你却非要逼着大家组队上,那多模型并行带来的太多额外花费,很快就能把公司账目搞崩。

简而言之,Fusion 是一场精准的账目精算。它是最牛模型非常好的平价替代,但绝对不是普通便宜模型的平价替代。

过去,科技公司靠不断堆出一个超级贵、超级大的单模型来垄断挣钱。 但现在,这种垄断,正在被“便宜模型组合”、“聪明开关”加上“缓存优化”,这一套组合拳给打破了。

Fusion给了我们一个选择空间,在 AI 这个赛道下半场,你不需要买那个最贵的单模型了,一套足够聪明的调度系统也可以成为平替方案。

Fable 5 刚被封杀,OpenRouter 用「多模型协作」搞出了「平替天团」

04

三个没那么光鲜的工程黑洞

尽管概念惊艳,但目前 Fusion 依然无法直接替代 Fable 5。

作为一个尚处早期探索阶段的产物,在开发者和企业最在意的真实落地战场上,它暴露出三个不容忽视的致命短板。

 问题一:编程场景不实用

官方明确指出,Fusion并非编码模型的直接替代品,它更像一个带着搜索和运行环境的“高级智囊团”。 这决定了它在编程场景应用中的明显分化。在应对复杂架构设计、技术选型或百年不遇的报错原因时,它能发挥多方求证的优势;但在开发者日常写代码的主战场,它反而比普通模型难用得多。核心原因有三:

(1)写代码要快,它太慢了:因为Fusion底下是好几个模型在协作,反应速度根本跟不上你在编辑器里敲代码的节奏,像代码补全、修语法这种要秒回的活儿,它干不了。 

(2)处理大工程容易“断片”:在面对超长上下文或“整个仓库重构”级别的任务时,Fusion 那种把任务切给好几个模型的做法,很容易让上下文断掉,目前无法像 Fable 5 那样完美保持 200k+ token 的长程连贯性。

(3)拼出来的代码可能根本跑不起来:有深度用户反馈,它的裁判模型只负责在意思上“开会总结”,没有真正的编译器去当场验证。这导致它有时候会犯很低级的工程错误,把不同语言、甚至逻辑互相打架的代码片段硬缝在一起,结果代码一跑就崩。

问题二:非常慢

由于 Fusion要同时叫好几个不同的模型一起干活,所以它的反应速度特别慢,通常耗时是单一普通模型的 2 到 4 倍。

这就像一群人一起做一件事,必须等最磨蹭的那个人干完,大家才能往下走。

系统必须等所有模型全跑完,整个链条的总时间,就直接卡在后台反应最慢、网络最卡的那个模型身上。更花时间的是,等所有模型都交卷了,后台还得让裁判模型把所有结果处理一遍,才能生成最终答案。

在今天这个连“首字延迟”都要按毫秒抠的实际工作场景中,这种慢可以说是致命的,这也注定了它没法用在实时客服聊天,或者代码即时补全这种要速度的战场上。 

问题三:数据合规的黑箱

这是企业系统落地时最难规避的合规死穴。当开发者向 Fusion 发起请求,意味着同一个提示词和上下文,在同一秒内经过了全球多家不同的 AI 服务商的服务器。

面对严苛的数据隐私法规,企业的法务和网络安全团队必须评估多路分发带来的隐患:这些服务商会如何留存数据?OpenRouter 作为中间路由层,又能否提供有效的技术担保?这个问题的答案目前依然是不透明的。

Fable 5 刚被封杀,OpenRouter 用「多模型协作」搞出了「平替天团」

05

多模型协作时代全面到来了吗?

在 Fusion 身上,有人看到了“多模型协作(MoA)”的强势崛起,也有人嘲笑这是 AI 发展从“炼丹求道”向“缝缝补补的软件工程”的倒退。

过去两年,整个行业陷入了对“万亿参数单体战神”的盲目崇拜中,坚信只要算力足够大,就能大力出奇迹。但随着算力边际效应的递减,Fusion 用一套精巧的拼盘方案证明了:系统的整体能力,完全可以大于单体之和。

这套逻辑,正在从三个维度重塑整个 AI 行业的底层逻辑:

1.商业权力的重构:打破“超级模型”的定价霸权

长期以来,像 Anthropic 或 OpenAI 这样的头部玩家,试图通过单体模型的能力碾压,建立起极高的定价护城河。

但 Fusion 的出现,是对这种商业模式的降维打击。一旦“一个 Opus + 三个中等模型”能打平 Fable 5,大模型能力的“商品化”时代就真正到来了。

底层模型将变得像云服务器里的 CPU 算力一样,不再具有不可替代的神秘光环。

这不仅会逼着前沿大模型重新想想自己是不是卖太贵了,甚至得降价,还会催生出像 OpenRouter 这样,手里握着“流量分发权”的超级路由平台。

在未来,谁掌握了调度系统,谁就掌握了 AI 时代的“终极入口”。

2.地缘政治风险让"多模型依赖"从可选变成必需。

Fable 5 发布仅三天就被紧急拔掉网线,给全球开发者上了一堂极其生动的一课:将全部业务核心押注在单一大模型上的风险,比很多开发者以为的要高。

Fusion 这类"拼盘"方案,在合规意义上也是一种风险对冲。

这也是国产大模型的绝佳窗口期。Fable 5 被封后,智谱迅速宣布 GLM-5.2 全量开放,并喊出“前沿智能不该被少数规则随时收回”。而 DeepSeek V4 Pro 等高性价比模型在 DRACO 测试中的惊艳表现,让市场意识到:

国产模型不需要在所有指标上死磕第一,只要能在 MoA 的“专家库”里占据一席之地,成为那 90% 高性价比流量的承接者,就已经是一场巨大的商业胜利。

3.技术演进的新瓶颈:得“主裁判”者得天下

当然,多模型协作绝非完美的乌托邦。当下限被一群廉价专家模型拉高时,整个系统的智力上限,死死卡在了“裁判模型”的瓶颈上。

裁判模型的综合评审能力、消除幻觉的能力以及对抗偏见的能力,决定了最终输出是“博采众长”还是“一地鸡毛”。如果裁判本身存在盲点,多模型协作反而会放大错误。

回望 Fusion API 爆火的这几天,它像是一个行业清醒剂。

"桌上还有很多盏小灯,把它们摆对位置,照样能照亮前路。"雷峰网(公众号:雷峰网)认为,对于当下的企业和开发者而言,Fusion 值不值得用?答案已经写在了它的架构基因里。

参考链接:

https://x.com/OpenRouter/status/2065856853989270011

Fable 5 刚被封杀,OpenRouter 用「多模型协作」搞出了「平替天团」
Fable 5 刚被封杀,OpenRouter 用「多模型协作」搞出了「平替天团」

雷峰网原创文章,未经授权禁止转载。详情见转载须知

Fable 5 刚被封杀,OpenRouter 用「多模型协作」搞出了「平替天团」