Kimi 的一體化，Manus 的分層

一、

前天，Kimi 突然發佈了旗艦模型 K2.5，事先沒有一點風聲。

在國內，Kimi 是比較低調的公司，關注度相對不高。但是，它的產品並不弱。

半年前，K2 模型一鳴驚人，得到了很高的評價，公認屬於全球第一梯隊。所以，新版本 K2.5 出來以後，立刻上了新聞，在黑客新聞、推特等平臺都是熱門話題。

著名開發者 Simon Willion 當天就寫了詳細介紹。

但是，這一次真正有趣的地方，不是模型本身，而是 Kimi 做了另一件事。

二、

這次的 K2.5 很強，各方面比 K2 都有進步。官方給出的評測跑分，基本都是全球前三位，甚至第一名（見發佈說明）。

根據 LMArena（現改名為 arena.ai）的榜單，Kimi K2.5 的編碼能力，是所有開源模型的第一，在總榜上僅次於 Claude 和 Gemini（下圖）。

但是，最大的亮點其實不是模型，而是 Kimi 同時發佈了一個基於這個模型的 Agent（智能體）。

也就是說，這次其實同時發佈了兩樣東西：K2.5 模型和 K2.5 Agent。K2.5 是底層模型，K2.5 Agent 則是面向最終用戶的一個網絡應用。

我的印象中，這好像是第一次，大模型公司這麼幹。以前發佈的都是模型本身，沒見過誰把模型和 Agent 綁在一起發佈的。

這麼說吧，Kimi 走上了一體化的道路。

三、

大家知道，大模型是底層的處理引擎，Agent 是面向用戶的上層應用。

它們的關係無非就是兩種：分層開發和一體化。前者是大模型跟 agent 分開，各自開發；後者是做成一個整體一起開發。

前不久，被 Meta 公司高價收購的 Manus，就是分層開發的最好例子。

Manus 使用的模型是 Anthropic 公司的 Claude，它自己在其上開發一個獨立的智能體，最終被收購。

它的成功鼓舞了許多人投入智能體的開發。因為模型的投入太大，不是誰都能搞的，而智能體的投入比較少，再小的開發者都能搞。

Kimi 這一次的嘗試，則是朝著另一個方向邁出了一大步，把大模型和 Agent 合在了一起。畢竟，大模型公司自己來做這件事更方便，更有利於擴大市場份額、爭取用戶。

很難說，這兩種做法哪一種更好。就像手機一樣，蘋果和安卓的外部應用，可以更好地滿足用戶需求，而自帶的內置應用則能充分跟操作系統融合，用起來更順滑。

四、

模型的測試已經很多了，下面我就來測一下，這次發佈的 K2.5 Agent。

看得出來，Kimi 對 Agent 很重視，傾注了很大心血，發佈說明的大部分篇幅介紹的都是 Agent 的功能。

其中有幾個功能是比較常規的：

（1）Kimi Office Agent：專家級的 Word、Excel、PowerPoint 文件生成。

（2）Kimi Code：對標 Claude Code 的命令行工具，專門用於代碼生成。

（3）長程操作：一次性完成最多1500步的操作，這顯然在對標以多步驟操作聞名的 Manus。

我比較在意的是下面兩個全新的功能，都是第一次看到，其他公司好像沒有提過。