慣性聚合 高效追讀感興趣之博客、新聞、科技資訊
閱原文 以慣性聚合開啟

推薦訂閱源

博客园 - 司徒正美
V
V2EX
T
Tailwind CSS Blog
有赞技术团队
有赞技术团队
aimingoo的专栏
aimingoo的专栏
Apple Machine Learning Research
Apple Machine Learning Research
IT之家
IT之家
Blog — PlanetScale
Blog — PlanetScale
A
About on SuperTechFans
月光博客
月光博客
T
The Blog of Author Tim Ferriss
宝玉的分享
宝玉的分享
Martin Fowler
Martin Fowler
博客园 - 聂微东
The GitHub Blog
The GitHub Blog
V
Visual Studio Blog
WordPress大学
WordPress大学
酷 壳 – CoolShell
酷 壳 – CoolShell
Engineering at Meta
Engineering at Meta
GbyAI
GbyAI

阮一峰的网络日志

科技爱好者周刊(第 396 期):互联网通信的替代方案 科技爱好者周刊(第 396 期):互联网通信的替代方案 - 阮一峰的网络日志 科技爱好者周刊(第 395 期):软件开发的第三种方式 科技爱好者周刊(第 395 期):软件开发的第三种方式 - 阮一峰的网络日志 科技爱好者周刊(第 393 期):脑腐状态 科技爱好者周刊(第 392 期):axios 投毒与好莱坞式骗术 科技爱好者周刊(第 391 期):AI 的贫富分化 科技爱好者周刊(第 390 期):没有语料,大模型就是智障 套壳中国大模型撑起500亿美元估值?扒一扒 Cursor 的"套壳"疑云 科技爱好者周刊(第 389 期):未来如何招聘程序员 科技爱好者周刊(第 388 期):测试是新的护城河 零安装的"云养虾":ArkClaw 使用指南 科技爱好者周刊(第 387 期):你是领先的 科技爱好者周刊(第 386 期):当外卖员接入 AI 字节全家桶 Seed 2.0 + TRAE 玩转 Skill 科技爱好者周刊(第 385 期):马斯克害怕中国车企吗? 智谱旗舰 GLM-5 实测:对比 Opus 4.6 和 GPT-5.3-Codex 科技爱好者周刊(第 384 期):为什么软件股下跌 科技爱好者周刊(第 383 期):你是第几级 AI 编程 科技爱好者周刊(第 382 期):独立软件的黄昏 AI native Workspace 也许是智能体的下一阶段 科技爱好者周刊(第 381 期):中国 AI 大模型领导者在想什么 科技爱好者周刊(第 380 期):为什么人们拥抱"不对称收益" 科技爱好者周刊(第 379 期):《硅谷钢铁侠》摘录 我如何用 AI 处理历史遗留代码:MiniMax M2.1 升级体验 科技爱好者周刊(第 378 期):预测是新的互联网热点 科技爱好者周刊(第 377 期):14万美元的贫困线 科技爱好者周刊(第 376 期):太空数据中心的争议 科技爱好者周刊(第 375 期):一扇门的 Bug 终于有人做了 Subagent,TRAE 国内版 SOLO 模式来了 科技爱好者周刊(第 374 期):6GHz 的问题 VS Code 使用国产大模型 MiniMax M2 教程 科技爱好者周刊(第 373 期):数据模型是新产品的核心 国产大模型接入 Claude Code 教程:以 Doubao-Seed-Code 为例 科技爱好者周刊(第 372 期):软件界面如何设计 大模型比拼:MiniMax M2 vs GLM 4.6 vs Claude Sonnet 4.5 科技爱好者周刊(第 371 期):一个乐观主义者的专访 科技爱好者周刊(第 370 期):正确的代码高亮 错误处理:异常好于状态码 科技爱好者周刊(第 369 期):Tim 与罗永浩的对谈 科技爱好者周刊(第 368 期):不要这样管理软件团队 一天之内,智谱和 Anthropic 都发了最强编程模型 科技爱好者周刊(第 367 期):Nano Banana 的几个妙用 科技爱好者周刊(第 366 期):旧金山疯狂的 AI 广告 科技爱好者周刊(第 365 期):流量变现正在崩塌 科技爱好者周刊(第 364 期):最难还原的魔方 科技爱好者周刊(第 363 期):最好懂的神经网络解释 科技爱好者周刊(第 362 期):GitHub 工程师谈系统设计 科技爱好者周刊(第 361 期):暗网 Tor 安全吗? 科技爱好者周刊(第 360 期):Dan Wang 的新书
Kimi之融通,Manus之层递
阮一峰 · 2026-01-29 · via 阮一峰的网络日志

一、

前日,Kimi 意外推出旗舰之器 K2.5,未闻风声。

于国中,Kimi 乃隐晦之企,人望不隆。然其物非弱。

半岁前,K2 之器一鸣,誉满天下,公认为寰宇之冠。故新器 K2.5 既出,立登新闻,于黑客之讯、推特等处,皆成热论。

名匠 Simon Willion 当日即撰详述

然此番真正有趣者,非器本身,乃 Kimi 所为另事。

二、

今之 K2.5,甚强,较 K2 诸方皆进。官评之跑分,多居全球前三,乃至首甲(见)。发布之辞)。

依 LMArena(今更名 arena.ai)之排名之列Kimi K2.5 之编码之能,为诸开源模型之冠,然于总榜之中,仅次 Claude 与 Gemini(见下图)。

然,至要之点非模型也,实乃 Kimi 更同日发布一基于此模型之 Agent(智能体)。

即谓是也。是故今次实并出二物:K2.5 模式与 K2.5 Agent。。K2.5 乃底层之模,K2.5 Agent 则为面向终人之网络之用。

吾之印象,此盖首次,大模之司如此为之。曩者所布者,皆模本身,未尝见者将模与 Agent 绑而发之。

如此言,Kimi 已踏上统合之途。

三、

众知,大模者,底层之引擎也;Agent 者上承于用者也。

其关系不外二途:分层数之开与统合之开。前者,大模与 Agent 分而各开;后者,成其整体而共开。

曩日,Meta 之司以重金收 Manus,此乃分层数开之至例也。

《手记》载,Manus所倚之模,乃Anthropic公司之Claude。其自于上构一独立之智能体,终为收购。

其成,鼓舞众志,投身智能体之研。然模型之资甚巨,非人人可及;智能体之费较微,虽小者亦能为之。

Kimi此次之试,则向别径迈一大步,合大模型与Agent。盖大模公司自为之,更便,利于拓市、争用。

孰优孰劣,未易言也。犹若手机,苹果与安卓之外应,可更足用户之需;而自具之内置应,则能尽融于系统,用之更畅。

四、

模型之试已夥,今试K2.5 Agent,以观其效。

可知Kimi于Agent甚为珍视,倾注心血良多。布告说明其文之大部分,皆述 Agent 之功能也。

其中数项功能,颇为寻常。

(1)Kimi Office 代理:专精于 Word、Excel、PowerPoint 文件之创制。

(二)基米代码:效法 Claude Code 之命令行器,专司代码生成之事。

(三)远程之务:一蹴可成千五百步,此诚与以多步骤操作闻名的 Manus 相匹。

吾所重者,乃下二新创之能,皆前所未见,他公司似未尝言及。

(4)视觉编程:借模型之视觉,通晓图像与视频,进而用于编程。但上传设计图与网页视频,即可成网页。

(5)蜂群之能(agent swarm):遇繁难之务,Agent 内自召百个 Agent,合成群集,并发执行,如并下载、并生成等。

限于篇幅,吾简述吾"视觉编程"之试果。

五、

首当启之。Kimi 官网(Kimi Official Website)K2.5已启程,可直用(见下图)。

谨记,当使此模型切换于"智能体模式" K2.5 Agent。

吾初试乃动效之生成,即上传动画之视频,令其生成。下为原始动画,乃用Lottie 库(Lottie)已之。

既上,于页中入辞曰:

视频中所呈动画之效,悉如一辙,复现于网页之上。

模型瞬息洞悉,此乃橘猫戏球之动画。复奇,竟将动画每一帧皆截为图像,以复原之。

终,乃以 Python 生成 SVG 动画之文。

尾、目、小球滚之动画,皆已正复。惜乎,主体之小猫,乃由多SVG形拼合,难似也。

众皆可往此网址,察其终效与网页之码。

六、

次试乃上传网之视频,令模型生网。

吾于B站,偶择一者设计师之网之视频

众可往访之此网站也观其本页之效。

吾将视频上传于模型,复命之曰:"使视频中所含之网站得以复原。"

所生之果(下图)远胜吾之预期,还原之度甚高,几可直上。

众皆可往此网址,观其成也。

简试之后,吾评曰,Kimi K2.5 Agent之"视觉编程"非虚言,实具视觉洞悉之力,足生可用之果。

观之,Kimi 此番"模型与 Agent 相融"之尝试,似有所成。一则,强 Agent 得以发挥模型之能,便利于人;二则,模型藉 Agent 拓展诸般用例,可引更多之众,于己亦利。

终,当世竞逐之局,一体化复有殊胜。

Manus所恃者,美利坚之模也,终不得不择海外立公司。而Kimi之底模,乃自研,且开源,全无掣肘之患。

(畢)