慣性聚合 関心のあるブログ、ニュース、テクノロジーを効率的に追跡
原文を読む 慣性聚合で開く

おすすめ購読元

博客园 - 司徒正美
V
V2EX
T
Tailwind CSS Blog
有赞技术团队
有赞技术团队
aimingoo的专栏
aimingoo的专栏
Apple Machine Learning Research
Apple Machine Learning Research
IT之家
IT之家
Blog — PlanetScale
Blog — PlanetScale
A
About on SuperTechFans
月光博客
月光博客
T
The Blog of Author Tim Ferriss
宝玉的分享
宝玉的分享
Martin Fowler
Martin Fowler
博客园 - 聂微东
The GitHub Blog
The GitHub Blog
V
Visual Studio Blog
WordPress大学
WordPress大学
酷 壳 – CoolShell
酷 壳 – CoolShell
Engineering at Meta
Engineering at Meta
GbyAI
GbyAI

阮一峰的网络日志

科技爱好者周刊(第 396 期):互联网通信的替代方案 科技爱好者周刊(第 396 期):互联网通信的替代方案 - 阮一峰的网络日志 科技爱好者周刊(第 395 期):软件开发的第三种方式 科技爱好者周刊(第 395 期):软件开发的第三种方式 - 阮一峰的网络日志 科技爱好者周刊(第 393 期):脑腐状态 科技爱好者周刊(第 392 期):axios 投毒与好莱坞式骗术 科技爱好者周刊(第 391 期):AI 的贫富分化 科技爱好者周刊(第 390 期):没有语料,大模型就是智障 套壳中国大模型撑起500亿美元估值?扒一扒 Cursor 的"套壳"疑云 科技爱好者周刊(第 389 期):未来如何招聘程序员 科技爱好者周刊(第 388 期):测试是新的护城河 零安装的"云养虾":ArkClaw 使用指南 科技爱好者周刊(第 387 期):你是领先的 科技爱好者周刊(第 386 期):当外卖员接入 AI 字节全家桶 Seed 2.0 + TRAE 玩转 Skill 科技爱好者周刊(第 385 期):马斯克害怕中国车企吗? 智谱旗舰 GLM-5 实测:对比 Opus 4.6 和 GPT-5.3-Codex 科技爱好者周刊(第 384 期):为什么软件股下跌 科技爱好者周刊(第 383 期):你是第几级 AI 编程 Kimi 的一体化,Manus 的分层 科技爱好者周刊(第 382 期):独立软件的黄昏 科技爱好者周刊(第 381 期):中国 AI 大模型领导者在想什么 科技爱好者周刊(第 380 期):为什么人们拥抱"不对称收益" 科技爱好者周刊(第 379 期):《硅谷钢铁侠》摘录 我如何用 AI 处理历史遗留代码:MiniMax M2.1 升级体验 科技爱好者周刊(第 378 期):预测是新的互联网热点 科技爱好者周刊(第 377 期):14万美元的贫困线 科技爱好者周刊(第 376 期):太空数据中心的争议 科技爱好者周刊(第 375 期):一扇门的 Bug 终于有人做了 Subagent,TRAE 国内版 SOLO 模式来了 科技爱好者周刊(第 374 期):6GHz 的问题 VS Code 使用国产大模型 MiniMax M2 教程 科技爱好者周刊(第 373 期):数据模型是新产品的核心 国产大模型接入 Claude Code 教程:以 Doubao-Seed-Code 为例 科技爱好者周刊(第 372 期):软件界面如何设计 大模型比拼:MiniMax M2 vs GLM 4.6 vs Claude Sonnet 4.5 科技爱好者周刊(第 371 期):一个乐观主义者的专访 科技爱好者周刊(第 370 期):正确的代码高亮 错误处理:异常好于状态码 科技爱好者周刊(第 369 期):Tim 与罗永浩的对谈 科技爱好者周刊(第 368 期):不要这样管理软件团队 一天之内,智谱和 Anthropic 都发了最强编程模型 科技爱好者周刊(第 367 期):Nano Banana 的几个妙用 科技爱好者周刊(第 366 期):旧金山疯狂的 AI 广告 科技爱好者周刊(第 365 期):流量变现正在崩塌 科技爱好者周刊(第 364 期):最难还原的魔方 科技爱好者周刊(第 363 期):最好懂的神经网络解释 科技爱好者周刊(第 362 期):GitHub 工程师谈系统设计 科技爱好者周刊(第 361 期):暗网 Tor 安全吗? 科技爱好者周刊(第 360 期):Dan Wang 的新书
AIネイティブワークスペースは、知能体の次の段階かもしれません
阮一峰 · 2026-01-22 · via 阮一峰的网络日志

一、知能体の形態

皆さんに一つ質問しますAIの製品形態とは何でしょうか

大規模モデルはあくまで下層の処理エンジンであり

常にユーザーのニーズに対応するアプリケーション層の製品が必要です

このAIのアプリケーション層を「知能体(agent)」と呼びます

では

「知能体」はどのようなものとなるべきでしょうか__JHSNS_SEG_d41807d5_8__初期の知能体は対話アプリケーション(上図)に過ぎず__JHSNS_SEG_d41807d5_9__後には推論が加わり__JHSNS_SEG_d41807d5_10__複雑な問題を考えることができるようになりました__JHSNS_SEG_d41807d5_11__その後__JHSNS_SEG_d41807d5_12__専門分野へと発展し__JHSNS_SEG_d41807d5_13__プログラミング知能体(coding agent)、画像知能体、動画知能体などを派生させました__JHSNS_SEG_d41807d5_14__あるいはMCPに接続することで__JHSNS_SEG_d41807d5_15__外部アプリケーションの操作能力を得て__JHSNS_SEG_d41807d5_16__例えばOfficeファイルの生成やブラウザの操作などが可能になりました__JHSNS_SEG_d41807d5_17__これらの形態はほぼ成熟しており__JHSNS_SEG_d41807d5_18__多くの企業が次の段階の知能体の形態を探求しています

私は最近、MiniMax が新しくリリースした AI ネイティブ ワークスペース(AI 原生工作台)を使っていて、嬉しく思うのは、これが答えかもしれないということです。

二、Cowork と Skill

この新しい製品は、Anthropic 社が最近提案した二つの新しい概念である Cowork と Skill を組み合わせています。

Cowork とは、簡単に言えば、「コンピュータ操作アシスタント」です。これはプログラミング インターフェースのグラフィカルなバージョンで、プログラミングを知らないユーザーが自然言語で要求を言い表し、AI がその下のレベルのコードを生成して実行し、ローカルのコンピュータを自動的に操作してタスクを完了させます。

Skill はもっとシンプルで、これは予め設定されたプロンプト文で、「使用手引書」に相当し、AI に特定のタスクをどのように完了させるかを詳細に説明します。このように考えることができます。各 Skill は一つの専門家であり、AI に特定の分野のスキルを持たせます。

これら二つのもの、一つは操作アシスタントで、もう一つはエキスパートモードです。前者はAIを使ってコンピューターを操作し、後者はAIに専門スキルを持たせます。

これらが組み合わさるとどうなるでしょうか?

MiniMax AIネイティブワークスペースはまさにそのような製品で、CoworkとSkillを探求的に組み合わせ、両方の能力を備えています、完全に新たな製品形態です。

そのデスクトップエディション(desktop)はCowork能力を提供し、エキスパートモード(experts)はSkill能力を提供します。

三、デスクトップエディション操作アシスタント

次に、それが従来の知能体とどのように異なるかを示します。

そのデスクトップクライアントの位置づけは「AIネイティブワークステーション」であり、以下の能力を備えています。

  • ローカルファイルへの直接アクセス:読み書きが可能で、ファイルの自動アップロードやダウンロードも行うことができます。
  • 自動化ワークフロー:タスクを分割し、Web自動化を実行することができます。
  • 専門的な成果の提供:実行後、高品質な出力物を生成することができ、例えばExcelシート、PowerPointプレゼンテーション、フォーマットされたドキュメントなどです。
  • 長時間実行タスク:複雑なタスクについては、長時間実行でき、会話タイムアウトやコンテキスト制限の影響を受けません。

注意点として、コンピュータを操作し、インターネットと通信するため、実行前にディレクトリを指定し、操作すべきでないディレクトリへの読み書きを防ぎ、また元のファイルが削除や変更されるのを防ぐためのバックアップを取る必要があります。

まず、公式サイトからデスクトップクライアントをダウンロードしてください。Windows/Mac版の両方があります。新規登録ユーザーは現在無料で3日間のトライアルが可能です。

をインストールして実行すると、直接タスクインターフェースに進み、従来の対話ボックスが表示されます。

ここで実行ディレクトリを指定すると、「ワークステーション」モードに入り、そのディレクトリに対して操作できます。ソフトウェアは警告を表示し、リスクをヒントします。

この時点で、さまざまなタスクを実行させることができます。例えば、私はそれにさまざまな電子サービスの請求書PDFファイルを整理させ、まとめたExcelドキュメントを作成させました。

この時、現在のディレクトリにPython仮想環境を自動的にインストールし、Pythonスクリプトを作成して実行します。

すぐにExcelファイルが生成されます。

これにより、さまざまなファイル整理の作業もそれに任せることができます。例えば、写真の整理やファイルのリネームなどです。

それにはウェブの自動化も可能で、特定のウェブページを自動的に閲覧し、情報を抽出したり、内容を要約したりすることができます。

四、専門システム

はそのワークステーション機能を示しており、「デジタル従業員」として機能することができます。では、その「専門家システム」についても見てみましょう。

「専門家システム」とは、特定のヒントファイルを注入し、インテリジェントエージェントのスキルを拡張するもので、深い知識と能力を注入することに相当します。ユーザーはプライベートな知識ベースもアップロードすることができます。

皆さんは、そのウェブエンドを開き、「専門家を探る」メニューをクリックしてください。

システムにはいくつかの「事前設定された専門家」が組み込まれており、直接使用できます。

私はシステムが提供する「アイコン作成器」を選びました。これはロゴを作成するスキルで、どう使えるか試してみましょう。

私は「パンダがアイスクリームを食べている」ロゴを作成することを要求しました。システムはデザインスタイルを選択するよう促しました。

最終的に、選択可能な2つのファイル(座った姿と立った姿)が生成され、結果はそれほど悪くありませんでした。

五、新しいスキルの作成

既存の専門家に加え、システムは「私の専門家」というカスタムスキルを作成することも許可しています

能力の説明と指示を入力し、対応するMCP、サブエージェント、環境変数、Supabaseデータベースなどを追加できます

私は直接Anthropic社が提供するSkillファイルを入力して、結果を確認しました

私はfrontend-design(フロントエンドデザイン)スキルを選び、入力後に「私の専門家」ページで確認できます

注意点として、現在システムはスキルの説明ファイルの入力のみをサポートしており、静的リソースファイル(asset)のアップロードはまだサポートしていません。今後追加されることを期待しています

その専門家を選択した後、私はアルゴリズムの可視化ページを作成するように要求しました。

「ソートアルゴリズムの可視化サイトを作成し、一般的なソートアルゴリズムの可視化アニメーションをリストアップしてください。特定のアルゴリズムを選択すると、そのアルゴリズムのアニメーション効果が表示されます。」

生成プロセスは約10分かかり、結果が得られました。システムは10種類のソートアルゴリズムのアニメーションを生成し、直接本番環境にデプロイされました。

その後、私はアニメーションのカラーリングを少し調整しました。皆さんはこのサイトで結果を確認できます。とてもクールです。

六、まとめ

AI native Workspace AIスマートエージェントをローカルコンピューターに導入し、自動化操作が可能になりました。また、スキルインターフェースを追加し、外部の知識と能力を注入することができます。さらに、すべての操作は自然言語での会話で完了できるため、ユーザーの要件が低くなっています。

これにより、AI 智能体の想像力が広がり、それが実行できるタスクはモデルの能力に制限されるのではなく、私たちの想像力に制限されるようになります。

私は、この製品が次の段階の AI 智能体の発展方向を象徴しており、多くの新しい可能性を開き、私たちが探求するのを待っていると考えています。

(完了)