慣性聚合 高效追蹤和閱讀你感興趣的部落格、新聞、科技資訊
閱讀原文 在慣性聚合中打開

推薦訂閱源

博客园 - 司徒正美
V
V2EX
T
Tailwind CSS Blog
有赞技术团队
有赞技术团队
aimingoo的专栏
aimingoo的专栏
Apple Machine Learning Research
Apple Machine Learning Research
IT之家
IT之家
Blog — PlanetScale
Blog — PlanetScale
A
About on SuperTechFans
月光博客
月光博客
T
The Blog of Author Tim Ferriss
宝玉的分享
宝玉的分享
Martin Fowler
Martin Fowler
博客园 - 聂微东
The GitHub Blog
The GitHub Blog
V
Visual Studio Blog
WordPress大学
WordPress大学
酷 壳 – CoolShell
酷 壳 – CoolShell
Engineering at Meta
Engineering at Meta
GbyAI
GbyAI

阮一峰的网络日志

科技爱好者周刊(第 396 期):互联网通信的替代方案 科技爱好者周刊(第 396 期):互联网通信的替代方案 - 阮一峰的网络日志 科技爱好者周刊(第 395 期):软件开发的第三种方式 科技爱好者周刊(第 395 期):软件开发的第三种方式 - 阮一峰的网络日志 科技爱好者周刊(第 393 期):脑腐状态 科技爱好者周刊(第 392 期):axios 投毒与好莱坞式骗术 科技爱好者周刊(第 391 期):AI 的贫富分化 科技爱好者周刊(第 390 期):没有语料,大模型就是智障 套壳中国大模型撑起500亿美元估值?扒一扒 Cursor 的"套壳"疑云 科技爱好者周刊(第 389 期):未来如何招聘程序员 科技爱好者周刊(第 388 期):测试是新的护城河 零安装的"云养虾":ArkClaw 使用指南 科技爱好者周刊(第 387 期):你是领先的 科技爱好者周刊(第 386 期):当外卖员接入 AI 字节全家桶 Seed 2.0 + TRAE 玩转 Skill 科技爱好者周刊(第 385 期):马斯克害怕中国车企吗? 智谱旗舰 GLM-5 实测:对比 Opus 4.6 和 GPT-5.3-Codex 科技爱好者周刊(第 384 期):为什么软件股下跌 科技爱好者周刊(第 383 期):你是第几级 AI 编程 Kimi 的一体化,Manus 的分层 科技爱好者周刊(第 382 期):独立软件的黄昏 科技爱好者周刊(第 381 期):中国 AI 大模型领导者在想什么 科技爱好者周刊(第 380 期):为什么人们拥抱"不对称收益" 科技爱好者周刊(第 379 期):《硅谷钢铁侠》摘录 我如何用 AI 处理历史遗留代码:MiniMax M2.1 升级体验 科技爱好者周刊(第 378 期):预测是新的互联网热点 科技爱好者周刊(第 377 期):14万美元的贫困线 科技爱好者周刊(第 376 期):太空数据中心的争议 科技爱好者周刊(第 375 期):一扇门的 Bug 终于有人做了 Subagent,TRAE 国内版 SOLO 模式来了 科技爱好者周刊(第 374 期):6GHz 的问题 VS Code 使用国产大模型 MiniMax M2 教程 科技爱好者周刊(第 373 期):数据模型是新产品的核心 国产大模型接入 Claude Code 教程:以 Doubao-Seed-Code 为例 科技爱好者周刊(第 372 期):软件界面如何设计 大模型比拼:MiniMax M2 vs GLM 4.6 vs Claude Sonnet 4.5 科技爱好者周刊(第 371 期):一个乐观主义者的专访 科技爱好者周刊(第 370 期):正确的代码高亮 错误处理:异常好于状态码 科技爱好者周刊(第 369 期):Tim 与罗永浩的对谈 科技爱好者周刊(第 368 期):不要这样管理软件团队 一天之内,智谱和 Anthropic 都发了最强编程模型 科技爱好者周刊(第 367 期):Nano Banana 的几个妙用 科技爱好者周刊(第 366 期):旧金山疯狂的 AI 广告 科技爱好者周刊(第 365 期):流量变现正在崩塌 科技爱好者周刊(第 364 期):最难还原的魔方 科技爱好者周刊(第 363 期):最好懂的神经网络解释 科技爱好者周刊(第 362 期):GitHub 工程师谈系统设计 科技爱好者周刊(第 361 期):暗网 Tor 安全吗? 科技爱好者周刊(第 360 期):Dan Wang 的新书
AI native Workspace 也許是智能體的下一階段
阮一峰 · 2026-01-22 · via 阮一峰的网络日志

一、智能體的形態

我問大家一個問題,什麼是 AI 的產品形態?

大模型只是底層的處理引擎,你總是需要一個應用層產品,對接用戶的需求。這種 AI 的應用層,就稱為"智能體"(agent)。

那麼,問題就變成了,"智能體"應該是什麼樣?

早期的智能體只是對話應用(上圖),後面加入了推理,可以思考複雜問題。

後來,向專業領域發展,演變出編程智能體(coding agent)、圖像智能體、視頻智能體等等,或者接入 MCP,獲得外部應用操作能力,比如生成 Office 文件、操作瀏覽器。

這些形態基本已經成熟了,很多公司開始探索,下一階段的智能體會是什麼形態?

我最近在用 MiniMax 剛發佈的 AI native Workspace(AI 原生工作臺),欣喜地覺得,這可能就是答案。

二、Cowork 和 Skill

這個新產品,同時加入了 Anthropic 公司最近提出的兩個新概念:Cowork 和 Skill。

所謂 Cowork,簡單說,就是一個"計算機操作助手"。它本質是編程智能體的圖形界面版,讓不懂編程的用戶,用自然語言說出需求,再通過 AI 生成底層代碼並執行,自動操作本地計算機完成任務。

而 Skill 就更簡單了,它是一篇預設的提示詞,相當於"使用手冊",向 AI 詳細描述如何完成某一種特定任務。可以這樣理解,每一個 Skill 就是一個專家,讓 AI 擁有特定領域的技能。

這兩個東西,一個是操作助手,一個是專家模式。前者用 AI 來操作計算機,後者讓 AI 具備專門技能。

它們結合起來會怎樣?

MiniMax AI native Workspace 就是這樣一個產品,探索性地將 Cowork 和 Skill 結合在一起,同時具備兩種能力,完全是一種全新的產品形態。

它的桌面端(desktop)提供 Cowork 能力,專家模式(experts)則提供 Skill 能力。

三、桌面端操作助手

下面,我來展示,它跟傳統智能體的差異在哪裡。

它的桌面客戶端定位就是"AI 原生工作臺",具備以下能力。

  • 直接訪問本地文件:能夠讀寫,以及自動上傳或下載文件。
  • 自動化工作流程:能夠分解任務,運行 Web 自動化。
  • 交付專業成果:運行結束後可以生成高質量的交付產物,比如 Excel 電子表格、PowerPoint 幻燈片、格式化文檔。
  • 長時間運行任務:對於複雜任務,可以長時間運行,不受對話超時或上下文限制的影響。

注意,由於它可以操作計算機,並跟互聯網通信,執行之前,一定要指定目錄,防止讀寫不該操作的目錄,而且要有備份,防止原始文件被刪改。

首先,前往官網下載桌面客戶端,Windows/Mac 版本均有,新註冊用戶目前可以免費試用3天。

安裝後運行,直接進入任務界面,就是一個傳統的對話框。

這時指定運行目錄,就進入"工作臺"模式,可以對該目錄進行操作。軟件會跳出一個警告,提示風險。

這時,就可以讓它執行各種任務了。比如,我讓它整理各種電子服務的發票 PDF 文件,然後生成一個彙總的 Excel 文檔。

這時,它會在當前目錄裡面,自動安裝一個 Python 虛擬環境,然後生成 Python 腳本並執行。

很快就生成好了 Excel 文件。

以此類推,各種文件整理的事情,都能交給它,比如整理照片、文件重命名等等。

它還能進行網頁自動化,比如自動瀏覽某個網頁,並提取信息、總結內容。

四、專家系統

上面展示了它的工作臺功能,可以擔當"數字員工",下面再來看看它的"專家系統"。

所謂"專家系統",就是注入特定的提示詞文件,擴展智能體的技能,相當於深度的知識和能力注入。用戶還可以上傳私有知識庫。

大家可以打開它的網頁端,點擊左邊欄的"探索專家"。

系統內置了一些"預設專家",可以直接使用。

我選了一個系統提供的"Icon 製作器",就是製作 Logo 的技能,看看好不好用。

我要求製作一個"熊貓吃冰淇淋"的 Logo,系統提示要選擇一種設計風格。

最後生成了兩個文件(坐姿和站姿)供選擇,效果還不錯。

五、創建新技能

除了預設的專家,系統也允許你創建"我的專家",也就是某種自定義技能。

你需要輸入能力描述和指令,還可以添加對應的 MCP、SubAgent、環境變量、Supabase 數據庫等等。

我直接把 Anthropic 公司提供的 Skill 文件輸入,看看效果。

我選了 frontend-design(前端設計)技能,輸入以後就可以在"我的專家"分頁上看到。

注意,系統目前只支持輸入技能描述文件,還不支持上傳靜態資源文件(asset),希望後面可以加上。

選中這個專家以後,我要求生成一個算法可視化頁面。

"生成一個排序算法可視化網站,列出常見排序算法的可視化動畫。選中某個算法後,會展示該算法的動畫效果。"

生成過程大概十分鐘左右,就得到了結果。系統生成了十種排序算法的動畫,並直接部署上線。

我後來又調整了一下動畫配色,大家可以去這個網站看看效果,還是很酷的。

六、總結

AI native Workspace 將 AI 智能體引入了本地計算機,可以進行自動化操作,同時加入技能接口,允許注入外部知識和能力。並且,所有操作都可以通過自然語言對話完成,對用戶的要求低。

這一下子打開了 AI 智能體的想象空間,它所能完成的任務,將不再受限於模型的能力,而只受限於我們的想象力。

我認為,這個產品代表了下一階段 AI 智能體的發展方向,將開啟很多全新的可能性,等待我們去探索。

(完)