

























要約:現時点では、実行可能なビジュアルワークフローは実世界の産業展開における主流パラダイムとして登場し、高い信頼性と制御可能性を提供しています。しかし、現在の実践では、このようなワークフローはほぼ全て手動エンジニアリングによって構築されています:開発者はワークフローを慎重に設計し、各ステップのプロンプトを書き、要件が変化するたびにロジックを繰り返し修正する必要があり——これが開発をコスト高く、時間がかかり、エラーに陥りやすくしています。大規模言語モデルがこのマルチラウンドインタラクションプロセスを自動化できるかどうかを研究するため、私たちは自然言語から直接実行可能なビジュアルワークフローを生成するためのベンチマークであるChat2Workflowを導入し、性能を向上させるためのロバストなエージェントベースラインを提案します。このベンチマークは、実世界のビジネスワークフローの大規模なコレクションから構築され、各インスタンスは生成されたワークフローが変換され、DifyやCozeなどの実用的なワークフロープラットフォームに直接デプロイできるように設計されています。実験結果によると、最適な言語モデルはしばしば高レベルな意図を捉えることができますが、正しい、安定した、実行可能なワークフローを生成するのに苦労しており、特に複雑で進化する要件が与えられる場合です。私たちのエージェントベースラインは最大6.05%の解決率向上を提供しますが、残りの実世界のギャップはChat2Workflowを産業規格の自動化を進めるための基盤として位置づけます。コードは利用可能です。このURL。
| コメント: | 進行中 |
| 主題: | 計算と言語 (cs.CL);人工知能 (cs.AI);コンピュータビジョンとパターン認識 (cs.CV);機械学習 (cs.LG);マルチエージェントシステム (cs.MA) |
| 引用: | arXiv:2604.19667 [cs.CL] |
| (または arXiv:2604.19667v2 [cs.CL] このバージョン用) | |
| https://doi.org/10.48550/arXiv.2604.19667 DataCiteを通じてarXiv発行のDOI |
このコンテンツは慣性聚合(RSSリーダー)によって自動集約されています。参考としてご覧ください。 原文出典 — 著作権は原著者に帰属します。