惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

www.infosecurity-magazine.com
www.infosecurity-magazine.com
Security Archives - TechRepublic
Security Archives - TechRepublic
TaoSecurity Blog
TaoSecurity Blog
Cloudbric
Cloudbric
cs.CL updates on arXiv.org
cs.CL updates on arXiv.org
N
News and Events Feed by Topic
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
S
Securelist
The Cloudflare Blog
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
D
DataBreaches.Net
S
Schneier on Security
L
LangChain Blog
Jina AI
Jina AI
M
MIT News - Artificial intelligence
Recent Announcements
Recent Announcements
T
Tenable Blog
B
Blog RSS Feed
V
Visual Studio Blog
Simon Willison's Weblog
Simon Willison's Weblog
G
Google Developers Blog
T
The Exploit Database - CXSecurity.com
Exploit-DB.com RSS Feed
Exploit-DB.com RSS Feed
WordPress大学
WordPress大学
W
WeLiveSecurity
I
InfoQ
The Hacker News
The Hacker News
雷峰网
雷峰网
月光博客
月光博客
P
Privacy & Cybersecurity Law Blog
O
OpenAI News
Hacker News: Ask HN
Hacker News: Ask HN
T
Threat Research - Cisco Blogs
GbyAI
GbyAI
The Last Watchdog
The Last Watchdog
P
Privacy International News Feed
Cyberwarzone
Cyberwarzone
S
SegmentFault 最新的问题
L
Lohrmann on Cybersecurity
人人都是产品经理
人人都是产品经理
V
V2EX
V
Vulnerabilities – Threatpost
cs.CV updates on arXiv.org
cs.CV updates on arXiv.org
C
Cybersecurity and Infrastructure Security Agency CISA
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
T
Troy Hunt's Blog
Application and Cybersecurity Blog
Application and Cybersecurity Blog
阮一峰的网络日志
阮一峰的网络日志
SecWiki News
SecWiki News
Microsoft Azure Blog
Microsoft Azure Blog

老范讲故事|AI、大模型与商业世界的故事

美国AI监管盯上GPT-5.6,真正漏洞在哪? - 老范讲故事|AI、大模型与商业世界的故事 中国超算重回全球第一,超算和AI算力中心不是一回事,英伟达为什么在这一块不灵了? - 老范讲故事|AI、大模型与商业世界的故事 Elon Musk生日快乐,SpaceX收购Tesla,路上的5个问题。 - 老范讲故事|AI、大模型与商业世界的故事 婴幼儿纸尿裤甲酰胺罗生门:孩子体内来源成谜? - 老范讲故事|AI、大模型与商业世界的故事 Sakana AI跑分超越Mythos,但日本AI依然无法与中美竞争! - 老范讲故事|AI、大模型与商业世界的故事 美国指责荷兰ASML让中国得到了EUV光刻机零件,ASML反击,我没有卖任何EUV主机给中国? - 老范讲故事|AI、大模型与商业世界的故事 Anthropic 泄露 Fable 5的12万字提示词,能抄吗?一句话复活Fable5? - 老范讲故事|AI、大模型与商业世界的故事 Google DeepMind连续有大神投敌,Google这是要完? - 老范讲故事|AI、大模型与商业世界的故事 DeepSeek融资510亿,4个霸王条款,梁文锋如何拿捏资本? - 老范讲故事|AI、大模型与商业世界的故事 500亿港元上市,智谱继续飞,MiniMax却崩了,为什么??? - 老范讲故事|AI、大模型与商业世界的故事 英国16岁社媒禁令:孩子会被赶去哪里? - 老范讲故事|AI、大模型与商业世界的故事 山姆被约谈之后道歉了,以后还能去吗? - 老范讲故事|AI、大模型与商业世界的故事 AI Agent时代,普通人的避坑指南! - 老范讲故事|AI、大模型与商业世界的故事 马斯克敲钟,桑德斯收税:AI 财富到底该归谁? - 老范讲故事|AI、大模型与商业世界的故事 鹅腿阿姨翻车:清北学生不傻,缺的是社会认知! - 老范讲故事|AI、大模型与商业世界的故事 Mythos5和Fable5,被美国政府勒令全网下架,Anthropic求锤得锤? - 老范讲故事|AI、大模型与商业世界的故事 Anthropic 的 CEO万字长文,又在给全人类指点江山了? - 老范讲故事|AI、大模型与商业世界的故事 美国国防部 1260H 清单,仅仅是一种羞辱吗? - 老范讲故事|AI、大模型与商业世界的故事 印度IT被AI冲击,中国社媒在喊,印度完蛋了? - 老范讲故事|AI、大模型与商业世界的故事 时至今日——高考还能改变命运吗? - 老范讲故事|AI、大模型与商业世界的故事 Token账单爆炸:大厂到底错在哪里? - 老范讲故事|AI、大模型与商业世界的故事 钉钉内网7万字长文揭露,老板为了证明自己的管理合法性,如何摧毁产品? - 老范讲故事|AI、大模型与商业世界的故事 Anthropic喊停AI?真要暂停还是上市前造势? - 老范讲故事|AI、大模型与商业世界的故事 谷歌800亿融资,巴菲特久违接盘,背后有什么鬼故事? - 老范讲故事|AI、大模型与商业世界的故事 OpenAI合并ChatGPT和Codex,AI超级App路线浮出水面! - 老范讲故事|AI、大模型与商业世界的故事 AI 的切尔诺贝利时刻,真正可怕的不是事故,而是不愿意承认事实? - 老范讲故事|AI、大模型与商业世界的故事 英伟达N1X——去年DGX Spark的冷饭回锅了?这一次就能不一样吗? - 老范讲故事|AI、大模型与商业世界的故事 张雪机车WorldSSP五冠真相 - 老范讲故事|AI、大模型与商业世界的故事 法拉利卢切被群嘲的真正原因 - 老范讲故事|AI、大模型与商业世界的故事 Anthropic融资投后估值9650亿美金,距离万亿美金的350亿缺口藏了什么? - 老范讲故事|AI、大模型与商业世界的故事 教皇发布AI通谕——为什么只有Anthropic可以出现在梵蒂冈? - 老范讲故事|AI、大模型与商业世界的故事 宇树科技儿童节IPO,难道是玩具公司 - 老范讲故事|AI、大模型与商业世界的故事 华为韬定律,洪秀全说上帝是我哥,这两件事,有什么关系? - 老范讲故事|AI、大模型与商业世界的故事 DeepSeek融资背后的控制权之争 - 老范讲故事|AI、大模型与商业世界的故事 碳水脸背后的审美焦虑与鄙视链 - 老范讲故事|AI、大模型与商业世界的故事 Google I/O失焦与Gemini困局 - 老范讲故事|AI、大模型与商业世界的故事 国产存储双雄长鑫存储和长江存储冲刺上市,存储周期拐点将至? - 老范讲故事|AI、大模型与商业世界的故事 华为鸿蒙逼迫贡献者归档,亲自断送开源生态! - 老范讲故事|AI、大模型与商业世界的故事 三星罢工倒计时,中国HBM产业链的机会来了? - 老范讲故事|AI、大模型与商业世界的故事 英伟达H200解禁后的中国算力博弈 - 老范讲故事|AI、大模型与商业世界的故事 李想两小时播客:一个万人大厂 CEO,怎么看 AI 时代? - 老范讲故事|AI、大模型与商业世界的故事 ENEMY短剧爆火,50亿播放只有2392元收入? - 老范讲故事|AI、大模型与商业世界的故事 耿同学爆火背后的科研打假风险与边界 - 老范讲故事|AI、大模型与商业世界的故事 宇树GD01机甲卖390万:高达成真还是IPO广告? - 老范讲故事|AI、大模型与商业世界的故事 黄仁勋CMU演讲:这碗AI 毒鸡汤藏了什么? - 老范讲故事|AI、大模型与商业世界的故事 哪 8 家电车厂被约谈了?AI 时代的猎巫故事! - 老范讲故事|AI、大模型与商业世界的故事 Vibe Coding治网瘾?孩子为何越写越上瘾? - 老范讲故事|AI、大模型与商业世界的故事 Anthropic Pre-IPO 估值 1.2 万亿美金,超过 OpenAI 成为估值最高的 AI 企业,三层误解,一个风险 - 老范讲故事|AI、大模型与商业世界的故事 最新编程跑分 ProgramBench,大模型全军覆没,AI编程真正可怕在哪? - 老范讲故事|AI、大模型与商业世界的故事 三星家电为何卖不动:高端不尖低端不狠? - 老范讲故事|AI、大模型与商业世界的故事 豆包68到500元:5层认知差看懂AI收费! - 老范讲故事|AI、大模型与商业世界的故事 硅谷 CTO 放弃职位,投奔 Anthropic,难道仅仅是为了理想? - 老范讲故事|AI、大模型与商业世界的故事 FDE爆火:企业AI最后一公里 - 老范讲故事|AI、大模型与商业世界的故事 中国AI两周观察:美国投资人为何沉默 - 老范讲故事|AI、大模型与商业世界的故事 Elon Musk 2025打白工?财报上的 1583 亿美金薪酬,哪去了? - 老范讲故事|AI、大模型与商业世界的故事 武汉百度萝卜快跑武汉停摆,集中式管理就是制造单点故障隐患! - 老范讲故事|AI、大模型与商业世界的故事 DeepSeek V4 发布没炸场,却靠降价掀起革命? - 老范讲故事|AI、大模型与商业世界的故事 剪映即梦猫箱被约谈与AI标识新规解读 - 老范讲故事|AI、大模型与商业世界的故事 Meta收购Manus被叫停解析 - 老范讲故事|AI、大模型与商业世界的故事 高德地图冲击台湾导航市场 - 老范讲故事|AI、大模型与商业世界的故事 GPT-5.5与DeepSeek V4,AI 竞争进入新格局! - 老范讲故事|AI、大模型与商业世界的故事 马斯克买Cursor,不是为AI编程,而是掩盖xAI算力利用率? - 老范讲故事|AI、大模型与商业世界的故事 苹果印度385亿美元罚单?竟然是因为约泡,导致的? - 老范讲故事|AI、大模型与商业世界的故事 哪吒汽车被央视点名后,谁才是真正的车圈恒大? - 老范讲故事|AI、大模型与商业世界的故事 AI大厂高薪招文科生?真相不是翻身,而是抢叙事权! - 老范讲故事|AI、大模型与商业世界的故事 北京机器人半马冠军竟是手机厂商,荣耀凭什么包揽前三? - 老范讲故事|AI、大模型与商业世界的故事 SpaceX IPO估值争议全解析 - 老范讲故事|AI、大模型与商业世界的故事 DeepSeek融资别急着冲!100亿美金估值最危险的是退出难! - 老范讲故事|AI、大模型与商业世界的故事 幽灵外卖重罚35.97亿:拼多多为何独吞15.22亿? - 老范讲故事|AI、大模型与商业世界的故事 Claude KYC上线:中国开发者影响解析 - 老范讲故事|AI、大模型与商业世界的故事 微软龙虾要来了?CEO 亲自下场,为什么我却不看好? - 老范讲故事|AI、大模型与商业世界的故事 夸克网盘美剧链接为何一夜失效?天塌了,国家整治网盘传播美剧 - 老范讲故事|AI、大模型与商业世界的故事 XChat上线在即:马斯克真能做出美国版微信? - 老范讲故事|AI、大模型与商业世界的故事 中国AI末日论与追赶美国真相 - 老范讲故事|AI、大模型与商业世界的故事 SBTI 爆火背后的传播逻辑 - 老范讲故事|AI、大模型与商业世界的故事 Hermes Agent能替代OpenClaw吗?老范 实测后震惊了? - 老范讲故事|AI、大模型与商业世界的故事 Claude Mythos 到底多可怕?准备加入核不扩散公约吗? - 老范讲故事|AI、大模型与商业世界的故事 大厂为何招中学生?5个真实目的,说透大学与AI时代! - 老范讲故事|AI、大模型与商业世界的故事 同事.skill爆火:AI蒸馏人与法律风险 - 老范讲故事|AI、大模型与商业世界的故事 Sam Altman 都要见一下的,第一家 AI 一人公司 MedVi 创始人,到底是干什么的? - 老范讲故事|AI、大模型与商业世界的故事 AI裁员第一人?杰克·多西把Block改成了什么 - 老范讲故事|AI、大模型与商业世界的故事 清明节年轻人不扫祖坟,为什么跑去给曹操送布洛芬? - 老范讲故事|AI、大模型与商业世界的故事 张雪ZXMOTO夺冠争议全解析 - 老范讲故事|AI、大模型与商业世界的故事 Oracle裁员3万人,AI先清哪些岗位 - 老范讲故事|AI、大模型与商业世界的故事 Claude Code 源码泄露全解析 - 老范讲故事|AI、大模型与商业世界的故事 长护险全国铺开了,为什么真正的难题才刚开始? - 老范讲故事|AI、大模型与商业世界的故事
Anthropic举报阿里蒸馏Claude,林俊旸走后,新来的人必须证明老板选择自己是正确的! - 老范讲故事|AI、大模型与商业世界的故事
Luke Fan · 2026-06-26 · via 老范讲故事|AI、大模型与商业世界的故事

封面构图中一台标着 Claude 的大型服务器被许多匿名账号气泡围绕,旁边是阿里云形象的办公楼剪影和一条从开源标志转向闭源锁头的箭头,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

突发,Anthropic 实锤阿里巴巴正在丧心病狂地蒸馏 Claude。

大家好,欢迎收听老范讲故事的 YouTube 频道。

首先给三个数字,咱们稍微细品一下:25,000 个假账号,2,880 万次对话,连续 44 天不分昼夜地去蒸馏。这不是黑产薅羊毛,这是有人在系统地偷一个顶级 AI 的脑子。Anthropic 点名的就是阿里巴巴。

很多人就说,中国人又跑去偷美国 AI 了。这个事不需要讨论,中国人一直在蒸馏他们的 AI,这个事不需要否认。但是今天我们要讲的是另外三件事。

  1. 第一,阿里在偷偷地换赛道,从开源转闭源。
  2. 第二,举报方 Anthropic 自己正在被美国政府摁在地上摩擦,两个最顶尖的大模型被禁用了,他现在也要自救。
  3. 第三,也是最要命的,阿里一转身,全世界最后一根全尺寸开源的顶梁柱就这么塌了。这个才是真正让人唏嘘的地方。
一封写给参议院和白宫的举报信摊在桌面上,旁边堆着 25000 个小账号头像和 2880 万次对话的计数器,Claude 图标位于画面中央被放大镜审视,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

先把这个事情跟大家说一下。既然叫突发,怎么个突法呢?

2026 年 6 月 24 日,彭博社发了一篇文章,说我们看到了,一封信。这封信是 Anthropic 写给美国参议院银行委员会和白宫的,落款大概是 6 月 10 号,在一场 AI 听证会前面发出去的。这不是法庭质证的证据,是一方写给立法者的举报材料,还踩着听证会的点递上去了。这个细节是整件事情的一个关键。

4 月 22 日到 6 月 5 日,也就这 44 天里头,约 25,000 个假账号跟 Claude 对话了 2,880 万次,专挑两样东西去问:

  • 第一个是怎么写代码;
  • 第二个是智能体怎么去推理。

这就是 Claude 真正的看家本领。

今年 2 月份,Anthropic 实际上就已经投诉过一次了。当时是 DeepSeek、月之暗面和 MiniMax 三家,加起来是 24,000 个账号、1,600 万次的问询。而这一次阿里就一家,25,000 个账号、2,880 万次问询,比那三家加起来还多,真的是够狠,要么说丧心病狂呢。

但是这个事就是 Anthropic 说了,阿里这边并没有任何回复,就跟前面 DeepSeek、月之暗面和 MiniMax 是一样,他们是不会回复的。

阿里正在从开源转向闭源

一条时间轴从开源旗帜开始,经过人物离场、密集对话流、闭源模型上架,最后停在锁住的旗舰模型货架前,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

事情理清楚了,真正值得我们担心的是什么?是阿里在换方向。阿里一边换人,一边换方向,一边换赛道。

我们要看这个事情是从哪天开始的呢?是从 4 月 22 日开始的。那 4 月 22 日发生了什么呢?要注意,3 月 4 日半夜,阿里千问的灵魂人物、技术负责人林俊旸,在 X 上发了一句话说:

我要撤退了,离开我热爱的千问。

然后他就离开阿里出去创业去了。

当然他发完了这个以后,还稍微拉扯了一下,阿里内部还跟他稍微讲了讲,说你是不是能够留下来呀?最后不,我一定要走。而且在发这个 X 之前的 4 天,林俊旸还在小红书上挂招聘。说走就走,这事是非常非常反常的。

而且不只是他,同一天,后训练的负责人余博文,在更早一个月,千问 Code 的负责人惠彬原,都离开了阿里。公开的口径是架构拆分跟他的技术信仰冲突。当时圈里最火的标题是:千问开源时代要变了吗?

现在这个事基本上实锤了。林俊旸 3 月份走了,4 月份就开始大面积的蒸馏。到 5 月 19 日,千问 3.7-Max 上线,但是千问 3.7 就不再开源了。原来千问 3.6 是开源的,3.7 就不开源了。

所以基本上就是新来的一拨人,这拨人就是急功近利的一拨人,没有千问的各种品牌包袱,也不需要去维护任何名声,就直接生干了。最简单粗暴的方式就开干,干完了以后直接出闭源作品,就是这样的一个玩法。

咱们把四个日期定在一条时间轴上看一下:

  • 3 月 4 日,开源旗手出走,向闭源掉头;
  • 4 月 22 日,被指控大规模蒸馏开始;
  • 5 月 19 日,闭源模型千问 3.7-Max 上线;
  • 6 月 5 日,蒸馏戛然而止。

林俊旸还在千问高举开源的那几年,那个时候一次都没有报过说千问蒸馏谁的这样的问题。偏偏是在林俊旸走了以后,转向闭源整整 7 周之后才开始。闭源旗舰 5 月 19 号发布,正卡在这场蒸馏,也就是 4 月 22 日至 6 月 5 日的正中间。

一只手疯狂汲取 Claude 的看家本领,另一只手把闭源旗舰直接推上了货架:以后我们就玩闭源了,以后不再玩开源了。

阿里没有回应,证据也没有落实,仍是单方面的说法。但当两条线在日历上扣得这么紧,这真的是巧合吗?换了个人,换了个方向,换了个赛道,那打法会不会也跟着变呢?

原来你自己收集数据,自己去训练;现在别费劲了,人家都已经蒸馏 Claude,都已经做出产品来了。特别是有新人上来的时候,大家注意,新人上来第一件事要干嘛?要证明前面那个人是傻瓜,我才厉害呢。那怎么能够做这个证明?弯道超车。怎么去弯道超车?蒸馏。一定是走这条路。

转进闭源红海,要抢写代码、做智能体这种硬的护城河,就有了抄近路的动机。而蒸馏就是最快的近路。这是阿里第一条线。

Anthropic 自己也在自救

Anthropic 站在国会听证会讲台前,一边模型服务器被红色禁用封条压住,另一边举起写有中国偷我字样的求助牌,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

下一个线是什么?就是 Anthropic 自己。Anthropic 自己也正被摁在地上摩擦呢。

6 月 9 日,Anthropic 高调上线了两款旗舰:Fable 5 和 Mythos 5。三天之后,6 月 12 日,商务部长卢特尼克亲笔信给了 CEO 达里奥·阿莫迪,说全球所有外国人立刻下架这两款模型。这个外国人,即使是在美国也不行,即使在你公司里的雇员也不行。

导火索是什么?导火索是亚马逊的研究员把这两个模型的安全护栏完全给绕过去了。Anthropic 在举报信里头特意警告,被蒸馏的模型往往缺乏安全护栏。结果他自己的旗舰,护栏先被当场捅穿了。到今天还关着呢,关了十来天了。嘴上说过几天恢复,外边押注的大概是 7 月份,Fable 应该能够回来。

一边自己被禁,急着解禁;一边跳出来当受害的国家队,告诉国会、白宫:中国在偷我,你们得保护我,给我松绑,让我赶快往前跑,要不然的话这事就危险了。这一告,是举报,是公关,更是游说。

别忘了钱。Anthropic 是一个估值 9,650 亿美元的公司,马上要去冲 IPO 的。他 6 月 1 号偷偷提交的 IPO 申请,而且他这个 IPO 应该真的是近在眼前了。谷歌现在很多人在往 Anthropic 跑,为什么?就是跟他一块 IPO 的。对于硅谷的公司来说,IPO 就是最大的造富机会。现在这么多谷歌已经很资深的人过去,就是先分股股票,IPO 上市的时候我们挣一笔,就要干这个事。

在这个时候,Anthropic 最怕的其实并不是被人山寨、被人蒸馏。他现在最怕的是,把他的模型摁在地上不让发布的这段时间里头,别人追上。而现在看来的话,追上 Fable、追上 Mythos 本身这件事情并没有那么难,因为 OpenRouter 的 Fusion 以及日本 Sakana AI 的 Fugu,其实已经通过使用多模型编排的方式,可以接近 Fable 5 和 Mythos 5 的能力了。

如果它这个真正最强的模型一直被摁着不让发布的话,那他这个优势就很容易失去了。这里边就有两笔账:一个是地缘账,一个是股价的账。

地缘政治与股价压力

美国和中国两张清单像棋盘一样对峙,阿里标识被夹在黑名单文件和下跌股价曲线之间,旁边有军工企业小图标相互拉黑,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

6 月 8 日,五角大楼 1260H 中国军工企业的清单里头,一口气加了 65 家,阿里就在里边,意味着 6 月底美国国防部不许跟你们做生意了。阿里咽不下去,6 月 23 日反手起诉了美国国防部,要求除名。

而且中国这边也进行了对等反制,把不可靠实体名单上加上了洛克希德·马丁、雷神什么都挂上了,还对 28 家美国军工企业搞两用物资的出口管制。两边互拉黑名单,军火商对军火商,科技巨头对科技巨头,这就是修昔底德陷阱:守成大国和崛起大国的结构性冲突。

正好阿里是在名单里头,8 号进的名单,10 号 Anthropic 就直接把信送上去了。这个事情都是紧锣密鼓跟在一起的。现在彭博社把这个信公开出来以后,阿里的股票马上跌了 3%,跌破了 100 美金。拉长了看,今年以来已经跌了 32%。

阿里做 AI 这件事情,这么长时间给阿里的股价其实没有什么帮助。就像小米一样,小米做了半天 AI,对于它的股价应该也是没有什么帮助的。但是公道地说,华尔街整体还是看多阿里的,更多的标签是强力买入,目标价是 190 美金,也就是短期挨锤,长期有戏。

矛盾就在,越 All in AI,短期就越难看;可掉队,长期故事就没了。

更大的问题:全尺寸开源支柱塌了

一座由 0.6B、7B、14B、32B、72B 等模型积木搭成的开源桥梁正在断裂,普通开发者拿着笔记本电脑站在桥下仰望,远处闭源高墙升起,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

在这里,我们不去研究阿里蒸馏 Anthropic 到底谁对谁错的问题。蒸馏肯定是有问题的,人家有用户协议,你去用人家的产品,你就要遵守用户协议,要不然你可以不用。你既然说我要用 Anthropic 的产品,我也花钱买了 25,000 个账号,也花钱去提了 2,880 万个问题,就说明什么?阿里是知法犯法。我明知道你不让,我非要干,这个肯定是偷,没什么好说的。

但是比偷这件事情更让我们痛苦的是什么呢?就是最后一根全尺寸开源的支柱就塌了。

阿里这一转身到底动了谁的奶酪?我的答案可能很颠覆:动的是全世界开发者赖以生存的开源生态。

你会说不对,大家都开源,不是只有阿里一家开源。Kimi、MiniMax、智谱 GLM、百度的文心、小米 MiMo,全都开源。就算阿里千问 3.7 闭源了,那前面 3.6 还是开源的呢。怎么一说阿里千问闭源,这个生态就塌了呢?

大家要注意一点,其他的这些开源,比如 Kimi、MiniMax、智谱,它都是开源一个巨大的模型权重出来。我开源了以后,你爱怎么用怎么用。但是这个东西普通人是部署不了的,你必须得到云计算的机房里,才能把这种大模型部署上去。

你像 Kimi 大概是 1T 参数,也就是 1 万亿参数;MiniMax 大概是接近 229B 这个参数了;智谱的话应该跟 MiniMax 差不太多;小米应该是 1T 的,都是这么大参数了。对于普通人来说,你开不开源跟我有屁关系?

但你说,我现在要使用开源模型,我现在需要一个从 0.6B 到 1.7B,到 7B,到 14B,到 32B,到 35B,到 72B,一直这么上来的一个模型。我在每一个大小上都需要一个开源模型,然后我要根据我自己的使用需求,在上面去进行微调,再去做后训练,去得到自己的模型。

原来干这个活最早是谁干?Llama 在干,就是 Meta 干。后来 Meta 说我不干了,再出到 Llama 4 的时候,只出一个最大的,其他都不出了。然后 Meta 说我彻底不开源了,我就自己闭源再折腾了。那么最后一个在干这件事情的人就是阿里千问,其他人都不干,只有他干。

所以现在谁想去用这种小模型,只能拿千问的模型去后训练、去微调,其他人都不做了。像前面咱们讲的,日本的 Sakana AI 使用的 Fugu,它里边就是用千问 2.5 的 7B 模型去做的后训练、去做的微调。

现在没人干了。从千问 3.7 以后,就再也没有新的这种全尺寸开源模型出来了。那么开源模型这条路可能就崩菜了。

开源大模型和全尺寸开源小模型不是一回事

画面左右对比,左侧是一台普通笔记本连接手机和嵌入式设备运行小模型,右侧是巨型云机房承载庞大模型权重,中间用分叉路牌标出两条开源赛道,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

开源模型其实是两件事:一个就是开源大模型,一个是全尺寸开源小模型。原来阿里是做全尺寸开源小模型的,Kimi、MiniMax、GLM、DeepSeek 都是做全开源大模型的,这是两条不同的赛道。

你说我要做一些小的项目,比如嵌入式设备,你必须要用开源小模型才能搞定。以后没人做了,这个还是非常非常遗憾的一个事情。

阿里原来的路线,也就是林俊旸的路线,是真正把开源做成普惠的基础设施,从手机到机房整条线都喂饱。全世界就阿里一家干这个活。别人开源只做旗舰展品,阿里开源是做整个货架的。

所以开源生态原来就是阿里唯一的一家上去维护这样的一块地方,维护全套设施的人只有阿里一个。他一转身去圈地搞闭源了,现在开源还在,但是人人都用得起的开源、全尺寸开源就没有了。

表面上吵的是阿里偷没偷 Claude,真正发生的是最后一根全谱系开源的顶梁柱正在叛逃,正在叛逃。

最后三句话

三张便签贴在一块浅色白板上,分别画着天平、围栏里的 API、逐渐熄灭的开源灯泡,白板前站着普通开发者思考未来方向,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

最后扒完了这么多层,给大家压箱底三句话。

  1. 第一,别急着站队。两个剧本可能同时为真:美国借国安清扫赛道,阿里换帅以后悄悄走上了闭源加抄近道的路。举报方也有私心,被告方肯定有问题。
  2. 第二,技术没有国界,商业和政治有。AI 拼到今天,不是谁更聪明,是谁更能把聪明圈进自己的篱笆里,圈进闭源的 API,圈进国家的黑名单,圈进招股书。
  3. 第三,别被偷没偷的口水仗带偏了视线。真正该盯紧的是,当最后一个全尺寸开源的旗手也离场了以后,我们这些买不起上万张显卡的普通人,还玩得动 AI 吗?这盏灯灭不灭,跟你我关系是最大的。

留给大家的两个问题

  1. 第一,阿里该不该转闭源?到底是识时务,还是丢了原来的灵魂?
  2. 第二,连阿里都收手了,你还相信开源 AI 有未来吗?

这两个问题,欢迎大家在评论区跟我去讨论。

好,故事就讲到这里。感谢大家收听,请帮忙点赞,点小铃铛,参加 Discord 讨论群,也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。


背景图片