Kimi 的一体化，Manus 的分层

一、

前天，Kimi 突然发布了旗舰模型 K2.5，事先没有一点风声。

在国内，Kimi 是比较低调的公司，关注度相对不高。但是，它的产品并不弱。

半年前，K2 模型一鸣惊人，得到了很高的评价，公认属于全球第一梯队。所以，新版本 K2.5 出来以后，立刻上了新闻，在黑客新闻、推特等平台都是热门话题。

著名开发者 Simon Willion 当天就写了详细介绍。

但是，这一次真正有趣的地方，不是模型本身，而是 Kimi 做了另一件事。

二、

这次的 K2.5 很强，各方面比 K2 都有进步。官方给出的评测跑分，基本都是全球前三位，甚至第一名（见发布说明）。

根据 LMArena（现改名为 arena.ai）的榜单，Kimi K2.5 的编码能力，是所有开源模型的第一，在总榜上仅次于 Claude 和 Gemini（下图）。

但是，最大的亮点其实不是模型，而是 Kimi 同时发布了一个基于这个模型的 Agent（智能体）。

也就是说，这次其实同时发布了两样东西：K2.5 模型和 K2.5 Agent。K2.5 是底层模型，K2.5 Agent 则是面向最终用户的一个网络应用。

我的印象中，这好像是第一次，大模型公司这么干。以前发布的都是模型本身，没见过谁把模型和 Agent 绑在一起发布的。

这么说吧，Kimi 走上了一体化的道路。

三、

大家知道，大模型是底层的处理引擎，Agent 是面向用户的上层应用。

它们的关系无非就是两种：分层开发和一体化。前者是大模型跟 agent 分开，各自开发；后者是做成一个整体一起开发。

前不久，被 Meta 公司高价收购的 Manus，就是分层开发的最好例子。

Manus 使用的模型是 Anthropic 公司的 Claude，它自己在其上开发一个独立的智能体，最终被收购。

它的成功鼓舞了许多人投入智能体的开发。因为模型的投入太大，不是谁都能搞的，而智能体的投入比较少，再小的开发者都能搞。

Kimi 这一次的尝试，则是朝着另一个方向迈出了一大步，把大模型和 Agent 合在了一起。毕竟，大模型公司自己来做这件事更方便，更有利于扩大市场份额、争取用户。

很难说，这两种做法哪一种更好。就像手机一样，苹果和安卓的外部应用，可以更好地满足用户需求，而自带的内置应用则能充分跟操作系统融合，用起来更顺滑。

四、

模型的测试已经很多了，下面我就来测一下，这次发布的 K2.5 Agent。

看得出来，Kimi 对 Agent 很重视，倾注了很大心血，发布说明的大部分篇幅介绍的都是 Agent 的功能。

其中有几个功能是比较常规的：

（1）Kimi Office Agent：专家级的 Word、Excel、PowerPoint 文件生成。

（2）Kimi Code：对标 Claude Code 的命令行工具，专门用于代码生成。

（3）长程操作：一次性完成最多1500步的操作，这显然在对标以多步骤操作闻名的 Manus。

我比较在意的是下面两个全新的功能，都是第一次看到，其他公司好像没有提过。