一、知能体の形態
皆さんに一つ質問しますAIの製品形態とは何でしょうか
大規模モデルはあくまで下層の処理エンジンであり
常にユーザーのニーズに対応するアプリケーション層の製品が必要です

このAIのアプリケーション層を「知能体(agent)」と呼びます
では
「知能体」はどのようなものとなるべきでしょうか__JHSNS_SEG_d41807d5_8__初期の知能体は対話アプリケーション(上図)に過ぎず__JHSNS_SEG_d41807d5_9__後には推論が加わり__JHSNS_SEG_d41807d5_10__複雑な問題を考えることができるようになりました__JHSNS_SEG_d41807d5_11__その後__JHSNS_SEG_d41807d5_12__専門分野へと発展し__JHSNS_SEG_d41807d5_13__プログラミング知能体(coding agent)、画像知能体、動画知能体などを派生させました__JHSNS_SEG_d41807d5_14__あるいはMCPに接続することで__JHSNS_SEG_d41807d5_15__外部アプリケーションの操作能力を得て__JHSNS_SEG_d41807d5_16__例えばOfficeファイルの生成やブラウザの操作などが可能になりました__JHSNS_SEG_d41807d5_17__これらの形態はほぼ成熟しており__JHSNS_SEG_d41807d5_18__多くの企業が次の段階の知能体の形態を探求しています

私は最近、MiniMax が新しくリリースした AI ネイティブ ワークスペース(AI 原生工作台)を使っていて、嬉しく思うのは、これが答えかもしれないということです。

二、Cowork と Skill
この新しい製品は、Anthropic 社が最近提案した二つの新しい概念である Cowork と Skill を組み合わせています。

Cowork とは、簡単に言えば、「コンピュータ操作アシスタント」です。これはプログラミング インターフェースのグラフィカルなバージョンで、プログラミングを知らないユーザーが自然言語で要求を言い表し、AI がその下のレベルのコードを生成して実行し、ローカルのコンピュータを自動的に操作してタスクを完了させます。

Skill はもっとシンプルで、これは予め設定されたプロンプト文で、「使用手引書」に相当し、AI に特定のタスクをどのように完了させるかを詳細に説明します。このように考えることができます。各 Skill は一つの専門家であり、AI に特定の分野のスキルを持たせます。
これら二つのもの、一つは操作アシスタントで、もう一つはエキスパートモードです。前者はAIを使ってコンピューターを操作し、後者はAIに専門スキルを持たせます。
これらが組み合わさるとどうなるでしょうか?

MiniMax AIネイティブワークスペースはまさにそのような製品で、CoworkとSkillを探求的に組み合わせ、両方の能力を備えています、完全に新たな製品形態です。
そのデスクトップエディション(desktop)はCowork能力を提供し、エキスパートモード(experts)はSkill能力を提供します。
三、デスクトップエディション操作アシスタント
次に、それが従来の知能体とどのように異なるかを示します。
そのデスクトップクライアントの位置づけは「AIネイティブワークステーション」であり、以下の能力を備えています。
- ローカルファイルへの直接アクセス:読み書きが可能で、ファイルの自動アップロードやダウンロードも行うことができます。
- 自動化ワークフロー:タスクを分割し、Web自動化を実行することができます。
- 専門的な成果の提供:実行後、高品質な出力物を生成することができ、例えばExcelシート、PowerPointプレゼンテーション、フォーマットされたドキュメントなどです。
- 長時間実行タスク:複雑なタスクについては、長時間実行でき、会話タイムアウトやコンテキスト制限の影響を受けません。
注意点として、コンピュータを操作し、インターネットと通信するため、実行前にディレクトリを指定し、操作すべきでないディレクトリへの読み書きを防ぎ、また元のファイルが削除や変更されるのを防ぐためのバックアップを取る必要があります。
まず、公式サイトからデスクトップクライアントをダウンロードしてください。Windows/Mac版の両方があります。新規登録ユーザーは現在無料で3日間のトライアルが可能です。

をインストールして実行すると、直接タスクインターフェースに進み、従来の対話ボックスが表示されます。

ここで実行ディレクトリを指定すると、「ワークステーション」モードに入り、そのディレクトリに対して操作できます。ソフトウェアは警告を表示し、リスクをヒントします。

この時点で、さまざまなタスクを実行させることができます。例えば、私はそれにさまざまな電子サービスの請求書PDFファイルを整理させ、まとめたExcelドキュメントを作成させました。

この時、現在のディレクトリにPython仮想環境を自動的にインストールし、Pythonスクリプトを作成して実行します。
すぐにExcelファイルが生成されます。

これにより、さまざまなファイル整理の作業もそれに任せることができます。例えば、写真の整理やファイルのリネームなどです。
それにはウェブの自動化も可能で、特定のウェブページを自動的に閲覧し、情報を抽出したり、内容を要約したりすることができます。
四、専門システム
はそのワークステーション機能を示しており、「デジタル従業員」として機能することができます。では、その「専門家システム」についても見てみましょう。
「専門家システム」とは、特定のヒントファイルを注入し、インテリジェントエージェントのスキルを拡張するもので、深い知識と能力を注入することに相当します。ユーザーはプライベートな知識ベースもアップロードすることができます。
皆さんは、そのウェブエンドを開き、「専門家を探る」メニューをクリックしてください。

システムにはいくつかの「事前設定された専門家」が組み込まれており、直接使用できます。

私はシステムが提供する「アイコン作成器」を選びました。これはロゴを作成するスキルで、どう使えるか試してみましょう。

私は「パンダがアイスクリームを食べている」ロゴを作成することを要求しました。システムはデザインスタイルを選択するよう促しました。

最終的に、選択可能な2つのファイル(座った姿と立った姿)が生成され、結果はそれほど悪くありませんでした。

五、新しいスキルの作成
既存の専門家に加え、システムは「私の専門家」というカスタムスキルを作成することも許可しています

能力の説明と指示を入力し、対応するMCP、サブエージェント、環境変数、Supabaseデータベースなどを追加できます

私は直接Anthropic社が提供するSkillファイルを入力して、結果を確認しました
私はfrontend-design(フロントエンドデザイン)スキルを選び、入力後に「私の専門家」ページで確認できます

注意点として、現在システムはスキルの説明ファイルの入力のみをサポートしており、静的リソースファイル(asset)のアップロードはまだサポートしていません。今後追加されることを期待しています
その専門家を選択した後、私はアルゴリズムの可視化ページを作成するように要求しました。
「ソートアルゴリズムの可視化サイトを作成し、一般的なソートアルゴリズムの可視化アニメーションをリストアップしてください。特定のアルゴリズムを選択すると、そのアルゴリズムのアニメーション効果が表示されます。」

生成プロセスは約10分かかり、結果が得られました。システムは10種類のソートアルゴリズムのアニメーションを生成し、直接本番環境にデプロイされました。

その後、私はアニメーションのカラーリングを少し調整しました。皆さんはこのサイトで結果を確認できます。とてもクールです。


六、まとめ
AI native Workspace AIスマートエージェントをローカルコンピューターに導入し、自動化操作が可能になりました。また、スキルインターフェースを追加し、外部の知識と能力を注入することができます。さらに、すべての操作は自然言語での会話で完了できるため、ユーザーの要件が低くなっています。
これにより、AI 智能体の想像力が広がり、それが実行できるタスクはモデルの能力に制限されるのではなく、私たちの想像力に制限されるようになります。
私は、この製品が次の段階の AI 智能体の発展方向を象徴しており、多くの新しい可能性を開き、私たちが探求するのを待っていると考えています。
(完了)












