Kimi之融通，Manus之层递

一、

前日，Kimi 意外推出旗舰之器 K2.5，未闻风声。

于国中，Kimi 乃隐晦之企，人望不隆。然其物非弱。

半岁前，K2 之器一鸣，誉满天下，公认为寰宇之冠。故新器 K2.5 既出，立登新闻，于黑客之讯、推特等处，皆成热论。

名匠 Simon Willion 当日即撰详述。

然此番真正有趣者，非器本身，乃 Kimi 所为另事。

二、

今之 K2.5，甚强，较 K2 诸方皆进。官评之跑分，多居全球前三，乃至首甲（见）。发布之辞）。

依 LMArena（今更名 arena.ai）之排名之列Kimi K2.5 之编码之能，为诸开源模型之冠，然于总榜之中，仅次 Claude 与 Gemini（见下图）。

然，至要之点非模型也，实乃 Kimi 更同日发布一基于此模型之 Agent（智能体）。

即谓是也。是故今次实并出二物：K2.5 模式与 K2.5 Agent。。K2.5 乃底层之模，K2.5 Agent 则为面向终人之网络之用。

吾之印象，此盖首次，大模之司如此为之。曩者所布者，皆模本身，未尝见者将模与 Agent 绑而发之。

如此言，Kimi 已踏上统合之途。

三、

众知，大模者，底层之引擎也；Agent 者上承于用者也。

其关系不外二途：分层数之开与统合之开。前者，大模与 Agent 分而各开；后者，成其整体而共开。

曩日，Meta 之司以重金收 Manus，此乃分层数开之至例也。

《手记》载，Manus所倚之模，乃Anthropic公司之Claude。其自于上构一独立之智能体，终为收购。

其成，鼓舞众志，投身智能体之研。然模型之资甚巨，非人人可及；智能体之费较微，虽小者亦能为之。

Kimi此次之试，则向别径迈一大步，合大模型与Agent。盖大模公司自为之，更便，利于拓市、争用。

孰优孰劣，未易言也。犹若手机，苹果与安卓之外应，可更足用户之需；而自具之内置应，则能尽融于系统，用之更畅。

四、

模型之试已夥，今试K2.5 Agent，以观其效。

可知Kimi于Agent甚为珍视，倾注心血良多。布告说明其文之大部分，皆述 Agent 之功能也。

其中数项功能，颇为寻常。

（1）Kimi Office 代理：专精于 Word、Excel、PowerPoint 文件之创制。

（二）基米代码：效法 Claude Code 之命令行器，专司代码生成之事。

（三）远程之务：一蹴可成千五百步，此诚与以多步骤操作闻名的 Manus 相匹。

吾所重者，乃下二新创之能，皆前所未见，他公司似未尝言及。

（4）视觉编程：借模型之视觉，通晓图像与视频，进而用于编程。但上传设计图与网页视频，即可成网页。

（5）蜂群之能（agent swarm）：遇繁难之务，Agent 内自召百个 Agent，合成群集，并发执行，如并下载、并生成等。

限于篇幅，吾简述吾"视觉编程"之试果。

五、

首当启之。Kimi 官网(Kimi Official Website)K2.5已启程，可直用（见下图）。

谨记，当使此模型切换于"智能体模式" K2.5 Agent。

吾初试乃动效之生成，即上传动画之视频，令其生成。下为原始动画，乃用Lottie 库(Lottie)已之。

既上，于页中入辞曰：

视频中所呈动画之效，悉如一辙，复现于网页之上。

模型瞬息洞悉，此乃橘猫戏球之动画。复奇，竟将动画每一帧皆截为图像，以复原之。

终，乃以 Python 生成 SVG 动画之文。

尾、目、小球滚之动画，皆已正复。惜乎，主体之小猫，乃由多SVG形拼合，难似也。

众皆可往此网址，察其终效与网页之码。

六、

次试乃上传网之视频，令模型生网。

吾于B站，偶择一者设计师之网之视频。

众可往访之此网站也观其本页之效。

吾将视频上传于模型，复命之曰："使视频中所含之网站得以复原。"

所生之果（下图）远胜吾之预期，还原之度甚高，几可直上。

众皆可往此网址，观其成也。

七

简试之后，吾评曰，Kimi K2.5 Agent之"视觉编程"非虚言，实具视觉洞悉之力，足生可用之果。

观之，Kimi 此番"模型与 Agent 相融"之尝试，似有所成。一则，强 Agent 得以发挥模型之能，便利于人；二则，模型藉 Agent 拓展诸般用例，可引更多之众，于己亦利。

终，当世竞逐之局，一体化复有殊胜。

Manus所恃者，美利坚之模也，终不得不择海外立公司。而Kimi之底模，乃自研，且开源，全无掣肘之患。

（畢）

推薦訂閱源

阮一峰的网络日志

一、

二、

三、

四、

五、

六、

七