慣性聚合 高效追讀感興趣之博客、新聞、科技資訊
閱原文 以慣性聚合開啟

推薦訂閱源

博客园 - 司徒正美
V
V2EX
T
Tailwind CSS Blog
有赞技术团队
有赞技术团队
aimingoo的专栏
aimingoo的专栏
Apple Machine Learning Research
Apple Machine Learning Research
IT之家
IT之家
Blog — PlanetScale
Blog — PlanetScale
A
About on SuperTechFans
月光博客
月光博客
T
The Blog of Author Tim Ferriss
宝玉的分享
宝玉的分享
Martin Fowler
Martin Fowler
博客园 - 聂微东
The GitHub Blog
The GitHub Blog
V
Visual Studio Blog
WordPress大学
WordPress大学
酷 壳 – CoolShell
酷 壳 – CoolShell
Engineering at Meta
Engineering at Meta
GbyAI
GbyAI

阮一峰的网络日志

科技爱好者周刊(第 396 期):互联网通信的替代方案 科技爱好者周刊(第 396 期):互联网通信的替代方案 - 阮一峰的网络日志 科技爱好者周刊(第 395 期):软件开发的第三种方式 科技爱好者周刊(第 395 期):软件开发的第三种方式 - 阮一峰的网络日志 科技爱好者周刊(第 393 期):脑腐状态 科技爱好者周刊(第 392 期):axios 投毒与好莱坞式骗术 科技爱好者周刊(第 391 期):AI 的贫富分化 科技爱好者周刊(第 390 期):没有语料,大模型就是智障 套壳中国大模型撑起500亿美元估值?扒一扒 Cursor 的"套壳"疑云 科技爱好者周刊(第 389 期):未来如何招聘程序员 科技爱好者周刊(第 388 期):测试是新的护城河 零安装的"云养虾":ArkClaw 使用指南 科技爱好者周刊(第 387 期):你是领先的 科技爱好者周刊(第 386 期):当外卖员接入 AI 字节全家桶 Seed 2.0 + TRAE 玩转 Skill 科技爱好者周刊(第 385 期):马斯克害怕中国车企吗? 智谱旗舰 GLM-5 实测:对比 Opus 4.6 和 GPT-5.3-Codex 科技爱好者周刊(第 384 期):为什么软件股下跌 科技爱好者周刊(第 383 期):你是第几级 AI 编程 Kimi 的一体化,Manus 的分层 科技爱好者周刊(第 382 期):独立软件的黄昏 科技爱好者周刊(第 381 期):中国 AI 大模型领导者在想什么 科技爱好者周刊(第 380 期):为什么人们拥抱"不对称收益" 科技爱好者周刊(第 379 期):《硅谷钢铁侠》摘录 我如何用 AI 处理历史遗留代码:MiniMax M2.1 升级体验 科技爱好者周刊(第 378 期):预测是新的互联网热点 科技爱好者周刊(第 377 期):14万美元的贫困线 科技爱好者周刊(第 376 期):太空数据中心的争议 科技爱好者周刊(第 375 期):一扇门的 Bug 终于有人做了 Subagent,TRAE 国内版 SOLO 模式来了 科技爱好者周刊(第 374 期):6GHz 的问题 VS Code 使用国产大模型 MiniMax M2 教程 科技爱好者周刊(第 373 期):数据模型是新产品的核心 国产大模型接入 Claude Code 教程:以 Doubao-Seed-Code 为例 科技爱好者周刊(第 372 期):软件界面如何设计 大模型比拼:MiniMax M2 vs GLM 4.6 vs Claude Sonnet 4.5 科技爱好者周刊(第 371 期):一个乐观主义者的专访 科技爱好者周刊(第 370 期):正确的代码高亮 错误处理:异常好于状态码 科技爱好者周刊(第 369 期):Tim 与罗永浩的对谈 科技爱好者周刊(第 368 期):不要这样管理软件团队 一天之内,智谱和 Anthropic 都发了最强编程模型 科技爱好者周刊(第 367 期):Nano Banana 的几个妙用 科技爱好者周刊(第 366 期):旧金山疯狂的 AI 广告 科技爱好者周刊(第 365 期):流量变现正在崩塌 科技爱好者周刊(第 364 期):最难还原的魔方 科技爱好者周刊(第 363 期):最好懂的神经网络解释 科技爱好者周刊(第 362 期):GitHub 工程师谈系统设计 科技爱好者周刊(第 361 期):暗网 Tor 安全吗? 科技爱好者周刊(第 360 期):Dan Wang 的新书
AI原生的Workspace,或为智能体之次第阶段也。
阮一峰 · 2026-01-22 · via 阮一峰的网络日志

一、智能之形

吾问诸君一问,所谓 AI 之产品形何如?

大模型者,惟为底层之处理引擎耳,恒需应用层产品以应众需。此 AI 之应用层,名曰"智能体"(agent)。

是故,问题转为:"智能体"当为何状?

昔者智能体惟为对话之用(上图),后增推理之能,可思繁复之题。

其后,渐向专业之域发展,衍出编程智能体(coding agent)、图像智能体、视频智能体等,或接 MCP,得外部应用操作之能,如生成 Office 文件、操作浏览器。

此等形态已渐成熟,多公司始探求,来日智能体当为何形?

吾近用 MiniMax 新出之 AI 原生工作台,欣然以为,此或为答案。

二、Cowork 与 Skill

此新产,兼采 Anthropic 公司近倡二义:Cowork 与 Skill。

Cowork者,简言之,乃"机操作助"。其本为编程智能之图形显,使不谙编程者,以自然言述所求,复由 AI 生成底层数码而执行,自动操本机以成事。

Skill则更简,乃预设之提示词,犹"使用手册",向AI详述如何成某特定之事。可如此解之:每一Skill即一专家,使AI具特定之能。

此二者,一为操作之助,一为专家之模。前者以 AI 操机,后者使 AI 具专技。

二者合之,将何如?

MiniMax AI 原生工作台,即此类之产也,探索性地合 Cowork 与 Skill,兼具二能,实为全新之产态。

其桌端(desktop)供 Cowork 之能,专家模(experts)供 Skill 之能。

三、桌端操作助手

今,吾示之,其与传统智能体之异处何在。

其桌端客户端,定位为"AI 原生工作台",具以下之能。

  • 直叩本地之文:可读可写,且能自上自下之文。
  • 自动化之程:能剖任务,行网自动化。
  • 交付专业之果:行毕可生高质之交付物,如 Excel 之电子表、PowerPoint 之幻灯、格式化之文。
  • 长时运行任务:于繁任务,可久行,不受对话超时或上下文所限。

然,因其可操机,通互联网,行前必定目录,防读写非所当之文,且须备份,防原文之删改。

首,往官网下载桌面客户端,Windows/Mac 版本俱有,新注册者今可免费试三日。

既装既行,直入任务之界,乃素常之对话也。

此时指定运行之域,则入"工台"之式,可施为于此域。软件忽现警示,示其风险。

于是,可令其行诸务。如吾令其整饬诸电子之发票PDF,复生成总括之Excel文书。

此时,自于当前之域,自动装置Python之虚拟境,复生Python之脚本而执行之。

俄而Excel之文书已成。

循此例,诸文件整饬之事,皆可委诸之,如整饬照片、文件更名等类。

复能行网页之自动化,如自动游览某网页,并撷取信息、撮要其文。

四、专家之系统。

上示其工台之能,可任"数职",下复观其"专系统"之妙。

所谓"专系统",乃注特定提示之文,扩智能之能,犹若深识厚能之灌注。用户亦可上传私有之智库。

诸君可启其网页之端,点左栏之"探专"。

系统内置数"预专",可直用之。

吾择系统所供"Icon制器",乃制Logo之能,观其善否。

吾求制"熊食冰"之Logo,系统示须择一设计之风。

终成二文(坐姿与立姿)以供择,效颇佳。

五、創立新技藝

除预设之专家外,系统亦允汝创建"吾之专家",盖某种自定之技能也。

尔需输入能力之描述与指令,亦可增补相应之MCP、SubAgent、环境变量、Supabase数据库等。

吾直将 Anthropic 公司所供技之文输入,观其效。

吾择焉前端设计(前端设计)之技,入之则可于"吾之专长"页见之。

注意,系统今唯支持输入技能描述之文,未支持上传静态之资(asset),冀其后续可增。

既择是专家,吾欲制算法之可视页面。

"制排序算法可视之网站,列常见排序算法之可视动画。择一算法,则示其动画之效。"

制之过程约十刻,遂得果。系统制十种排序算法之动画,直布之线上。

后吾复调动画之色,诸君可往此网站观其效,甚酷。

六、总括

AI native Workspace引AI智能体入本地之机,可为之自动化操作,且加技能之接口,许注外部之知与能。凡操作皆可由自然语言对话成,于用户之求甚微。

此乃启AI智能之想象界,其所成之事,不复囿于模型之力,惟囿于吾辈之想象耳。

吾以为,此产品乃AI智能下一阶段之发展之向,将启诸般全新之可能,待吾辈探索之。

(竟)