一、智能之形
吾问诸君一问,所谓 AI 之产品形何如?
大模型者,惟为底层之处理引擎耳,恒需应用层产品以应众需。此 AI 之应用层,名曰"智能体"(agent)。
是故,问题转为:"智能体"当为何状?

昔者智能体惟为对话之用(上图),后增推理之能,可思繁复之题。
其后,渐向专业之域发展,衍出编程智能体(coding agent)、图像智能体、视频智能体等,或接 MCP,得外部应用操作之能,如生成 Office 文件、操作浏览器。
此等形态已渐成熟,多公司始探求,来日智能体当为何形?

吾近用 MiniMax 新出之 AI 原生工作台,欣然以为,此或为答案。

二、Cowork 与 Skill
此新产,兼采 Anthropic 公司近倡二义:Cowork 与 Skill。

Cowork者,简言之,乃"机操作助"。其本为编程智能之图形显,使不谙编程者,以自然言述所求,复由 AI 生成底层数码而执行,自动操本机以成事。

Skill则更简,乃预设之提示词,犹"使用手册",向AI详述如何成某特定之事。可如此解之:每一Skill即一专家,使AI具特定之能。
此二者,一为操作之助,一为专家之模。前者以 AI 操机,后者使 AI 具专技。
二者合之,将何如?

MiniMax AI 原生工作台,即此类之产也,探索性地合 Cowork 与 Skill,兼具二能,实为全新之产态。
其桌端(desktop)供 Cowork 之能,专家模(experts)供 Skill 之能。
三、桌端操作助手
今,吾示之,其与传统智能体之异处何在。
其桌端客户端,定位为"AI 原生工作台",具以下之能。
- 直叩本地之文:可读可写,且能自上自下之文。
- 自动化之程:能剖任务,行网自动化。
- 交付专业之果:行毕可生高质之交付物,如 Excel 之电子表、PowerPoint 之幻灯、格式化之文。
- 长时运行任务:于繁任务,可久行,不受对话超时或上下文所限。
然,因其可操机,通互联网,行前必定目录,防读写非所当之文,且须备份,防原文之删改。
首,往官网下载桌面客户端,Windows/Mac 版本俱有,新注册者今可免费试三日。

既装既行,直入任务之界,乃素常之对话也。

此时指定运行之域,则入"工台"之式,可施为于此域。软件忽现警示,示其风险。

于是,可令其行诸务。如吾令其整饬诸电子之发票PDF,复生成总括之Excel文书。

此时,自于当前之域,自动装置Python之虚拟境,复生Python之脚本而执行之。
俄而Excel之文书已成。

循此例,诸文件整饬之事,皆可委诸之,如整饬照片、文件更名等类。
复能行网页之自动化,如自动游览某网页,并撷取信息、撮要其文。
四、专家之系统。
上示其工台之能,可任"数职",下复观其"专系统"之妙。
所谓"专系统",乃注特定提示之文,扩智能之能,犹若深识厚能之灌注。用户亦可上传私有之智库。
诸君可启其网页之端,点左栏之"探专"。

系统内置数"预专",可直用之。

吾择系统所供"Icon制器",乃制Logo之能,观其善否。

吾求制"熊食冰"之Logo,系统示须择一设计之风。

终成二文(坐姿与立姿)以供择,效颇佳。

五、創立新技藝
除预设之专家外,系统亦允汝创建"吾之专家",盖某种自定之技能也。

尔需输入能力之描述与指令,亦可增补相应之MCP、SubAgent、环境变量、Supabase数据库等。

吾直将 Anthropic 公司所供技之文输入,观其效。
吾择焉前端设计(前端设计)之技,入之则可于"吾之专长"页见之。

注意,系统今唯支持输入技能描述之文,未支持上传静态之资(asset),冀其后续可增。
既择是专家,吾欲制算法之可视页面。
"制排序算法可视之网站,列常见排序算法之可视动画。择一算法,则示其动画之效。"

制之过程约十刻,遂得果。系统制十种排序算法之动画,直布之线上。

后吾复调动画之色,诸君可往此网站观其效,甚酷。


六、总括
AI native Workspace引AI智能体入本地之机,可为之自动化操作,且加技能之接口,许注外部之知与能。凡操作皆可由自然语言对话成,于用户之求甚微。
此乃启AI智能之想象界,其所成之事,不复囿于模型之力,惟囿于吾辈之想象耳。
吾以为,此产品乃AI智能下一阶段之发展之向,将启诸般全新之可能,待吾辈探索之。
(竟)












