慣性聚合 関心のあるブログ、ニュース、テクノロジーを効率的に追跡
原文を読む 慣性聚合で開く

おすすめ購読元

博客园 - 司徒正美
V
V2EX
T
Tailwind CSS Blog
有赞技术团队
有赞技术团队
aimingoo的专栏
aimingoo的专栏
Apple Machine Learning Research
Apple Machine Learning Research
IT之家
IT之家
Blog — PlanetScale
Blog — PlanetScale
A
About on SuperTechFans
月光博客
月光博客
T
The Blog of Author Tim Ferriss
宝玉的分享
宝玉的分享
Martin Fowler
Martin Fowler
博客园 - 聂微东
The GitHub Blog
The GitHub Blog
V
Visual Studio Blog
WordPress大学
WordPress大学
酷 壳 – CoolShell
酷 壳 – CoolShell
Engineering at Meta
Engineering at Meta
GbyAI
GbyAI

博客园 - 漫思

SelectMany C# lodash 数组的常用做法 lodash里面的常用方法 技术的边界 Reduce 和 Transduce 的含义 尤雨溪创办的 VoidZero 官宣加入 Cloudflare,前端 Vite 等保持开源 Ramda 函数库参考教程 ramda es 数组的方法 flatmap map object.entity的教程 Map与FlatMap:在数据处理中的区别与联系 flat、flatmap与map的用法区别1 flat、flatmap与map的用法区别 AI不是从天而降,它经历了七十年三起三落:读懂AI的第三课 Agent 17 种架构模式 分析 & 思考 只有踩过坑才懂:前端生成唯一 ID,别用 Date.now ()了!试试它crypto.randomUUID() FastAPI python并发 代码是 AI 写的,生产事故谁背锅? AI Agent 走出 Demo 幻觉的唯一解药:Harness Engineering 高管的 AI 精神病 小米开源可控视频音效生成模型 ControlFoley ​IBM 联合红帽投资 50 亿美元:帮助企业确保开源软件安全 国家大基金领投 DeepSeek,首轮融资投前估值 450 亿美元 SpaceX 自研 AI 训练栈 V1.0 接近完工:用 C 重写、适配 22 万块 GB300 GPU 高管的 AI 精神病 - 漫思 做一款企业真正敢用的AI测试应用,到底有多难?究竟难在哪? - 漫思 工良吐槽篇:万字长文细说 AI 落地之笑谈 koarouter的路由基本能力 7. 简单语句 class-validator class- @koa/router 分路由 这是我见过的最好的koa2 classvalidate typeorm的能力 HLS.js destroy时会取消请求吗 从入门到精通:2025年本体管理工具选型指南,8款工具助你驾驭语义网络 C# 15 类型系统改进:Union Types skill网站 应无所住,而生其心 process.stdin.isTTY 谷歌学术走过风雨十年 听创始人畅谈苦辣酸甜 - 漫思 process.stdin.isTTY 是false的具体情况 asyncio 较为复杂的demo asyncio 简单demo python Annotated 独家解读:淘宝使用 Node.js 的 TypeScript 多场景开发和实践 mac uv 使用 Python 包管理工具 uv 使用教程 Python依赖管理新标杆:UV工具安装与实战指南 python的uv
初心者向けのAIエージェント入門:difyによる超高速AIエージェント構築
漫思 · 2026-05-24 · via 博客园 - 漫思

dify.AIの紹介

difyは、オープンソースのLLMアプリケーション開発のためのオープンソースプラットフォームで、エージェントの構築からAIワークフローの構成、RAG、エージェントなどを提供し、検索戦略、モデル管理などの機能をサポートし、AIアプリケーションの構築と運用を簡単に行うことができます。

最も重要なのは、LangChainよりも使いやすく、魅力的な番組があります。
デプロイとインストールのチュートリアルを見たい場合は、本文の目次を直接クリックしてください。

Difyは、生成型AIネイティブアプリケーションを構築するために必要なコア技術スタックをカバーし、開発者はアプリケーションのコア価値に集中できます。

Difyの主な特徴、利点、能力:

Difyの特徴と利点:

  1. Difyは、安全なデータチャネル、高信頼性のインデックス検索、親しみやすいプロンプト編集、複数モデルの切り替え、推論の監視、ログ記録、データアノテーション、モデルトレーニング、ファインチューニング、AI開発の簡素化、カスタマイズされたAgentの自動化、AIワークフローの編成などの利点を提供し、データの安全性、開発の効率性、モデルの最適化、自動化されたインテリジェンス、ワークフローの管理を実現し、開発者により簡単かつ柔軟にAIアプリケーションを構築するのを支援します。

difyの基本的な機能構成

機能特性リスト

カテゴリ内容
LLM推論エンジン Dify Runtime (v0.4以降でLangChainが削除されました)
サポートする商用モデル 10以上、OpenAIとAnthropicを含む<br>主流の新モデルは48時間以内に
対応しているMaaSベンダー 7社に接続可能です:Hugging Face, Replicate, AWS Bedrock, NVIDIA, GroqCloud, together.ai, OpenRouter
対応しているローカルモデル推論実行環境 6種類:Xoribits(推奨)、OpenLLM、LocalAI、ChatGLM、Ollama、NVIDIA TIS
OpenAIインターフェース標準モデル統合 無限にサポート
多様なモダリティ機能 ASR モデル、リッチテキストモデル(最高 GPT-4o 規格をサポート)
組み込みアプリケーションタイプ テキスト生成、チャットボット、エージェント、ワークフロー、対話フロー
Prompt-as-a-Service編成 高く評価されているビジュアル編成インターフェース、Prompt を集中して編集し、結果をプレビューできます
編成モード シンプル編成、エージェント編成、プロセス編成
Prompt 変数タイプ 文字列、単選列挙
外部 API サポート ファイル(2024 Q3 発表)
エージェントワークフロー機能 業界をリードするビジュアルワークフロー構成インターフェース、ノードのリアルタイム編集とデバッグ、モジュール化DSL、ネイティブコード実行時
対応ノード LLM、知識検索、問題分類器、IF/ELSE、コード、テンプレート、HTTPリクエスト、ツール
RAG機能 業界初のビジュアル知識ベース管理インターフェース、断片プレビューとリコールテストのサポート
インデックス方法 キーワード、テキストベクトル、LLMアシスト問題-断片モデル
検索方法 キーワード、テキスト類似度マッチング、混合検索、マルチパス検索、リオーダーモデル
リコール最適化 リオーダーモデル
ETL能力 自動クリーンアップTXT、Markdown、PDF、HTML、DOC、CSV形式のデータ;非構造化サービスをサポート
知識ベースの同期 Notion文書、ウェブページを知識ベースとして同期
サポートされるベクトルデータベース Qdrant(推奨)、Weaviate、Zilliz/Milvus、Pgvector、Pgvector-rs、Chroma、OpenSearch、TiDB、腾讯向量、Oracle、Relyt、Analyticdb、Couchbase
プロキシ技術 ReAct、関数呼び出し
ツールサポート はOpenAIプラグインの標準ツールを呼び出し、OpenAPI規範APIを直接ロードしてツール
に組み込みます 40+ツール(2024年第2四半期時点)
ログ記録 サポート、ログベースのコメント
コメント返信 人工によるアノテーションに基づくQ&A、類似性に基づく返信に使用;モデルを微調整するためのデータ形式にエクスポート可能
コンテンツ審査 OpenAIコンテンツ審査または外部API
チーム協力 ワークスペース、複数メンバーの管理
API規範 RESTful、大多数の機能をカバー
デプロイ方法 Docker、Helm

アプリケーションの構築方法

Difyにおける「アプリケーション」は、LLMなどの大規模言語モデルを基にした実際のシナリオアプリケーションであり、LLM、RAG、および低コード技術を特定のニーズに統合することを目的としています。AIアプリケーション開発のパターンと具体的な配信物が融合し、開発者に以下を提供します:

  • パッケージ化された親しみやすいAPI:バックエンドまたはフロントエンドアプリケーションが直接呼び出すことができ、Token認証を通じて統合プロセスを簡素化します。
  • すぐに使用できる、美しいホスティングのWebApp:テンプレートを二次開発にサポートし、ユーザーインターフェースを迅速に構築します。
  • 使いやすいインターフェース:プロンプトワードエンジニアリング、コンテキスト管理、ログ分析、および注釈機能を統合し、開発効率を向上させます。

開発者はニーズに応じてすべての機能または一部の機能を選択し、AIアプリケーションの効率的な開発を支援します。

アプリケーションのタイプ

Difyは五种のアプリケーションタイプを提供します:

  1. チャットアシスタント:LLMに基づいて対話型インタラクションを構築したアシスタントです。
  2. テキスト生成アプリケーション:テキスト生成タスクに対応するアシスタントで、例えばストーリー作成、テキスト分類、翻訳などがあります。
  3. Agent:タスクを分解し、推論思考を行い、ツールを呼び出すことができる対話型インテリジェントアシスタントです。
  4. 対話フロー(Chatflow):複雑なプロセスを設計する多轮対話シナリオに適しており、記憶機能をサポートし、動的なアプリケーションオーケストレーションが可能です。
  5. ワークフロー(Workflow):自動化やバッチ処理などの単轮生成型タスクのシナリオに適したアプリケーションオーケストレーション方法で、単方向に結果を生成します。

各アプリケーションタイプの機能の違いは以下の表の通りです:

機能テキスト生成アプリケーションチャットアシスタントエージェント対話流(Chatflow)ワークフロー(Workflow)
WebApp インターフェース フォーム+結果式 対話式 対話式 プロセス式 フォーム+プロセス式
WebAPI エンドポイント /completion-messages /chat-messages /chat-messages /chat-messages /workflows/run
インタラクション方法 一問一答 複数ラウンドの会話 複数ラウンドの会話 フローコントロール+複数ラウンドの会話 単ラウンド生成+複数ラウンドの会話
ストリーミング結果の返信 サポート サポート サポート サポート サポート
コンテキストの保存 当次 当次
ユーザー入力フォーム
知識ベースとツール
AI の挨拶 サポートしない サポートする サポートする サポートする サポートしない
シナリオ例 翻訳、判断、インデックス チャット タスク分解、推論 フロー制御、シナリオ定義 バッチ処理、自動化
リアルタイムフィードバック なし サポートする サポートする

を介して大規模モデル

をサポートしています。初めて使用する際は、Difyの設定(右上)--モデルサプライヤーページで必要なモデルを追加および設定する必要があります。

DifyはOpenAIのGPTシリーズ、AnthropicのClaudeシリーズ、deepseekなど複数の主流モデルサプライヤーをサポートしています。異なるモデルは能力やパラメータが異なるため、ユーザーは具体的なアプリケーションシナリオに合わせて適切なサプライヤーを選択できます。

ローカル環境では、ollamaやlmstudio、gpustackを使用してモデルをデプロイし、接続も簡単です。

商用大規模モデルの機能を使用する前に、大手モデルベンダーの公式サイトからAPIキーを取得する必要があります。

モデル分類

Difyは使用シナリオに基づいて大規模モデルを以下の四つのカテゴリーに分類しています:

  1. 対話推論大モデル:アプリケーション作成、知能会話、対話名生成、次の質問提案などの機能に使用されます。サポートしているサプライヤーにはOpenAI、Azure OpenAI Service、Anthropic、Hugging Face Hub、Replicate、Xinference、OpenLLM、讯飞星火(StarFire)、文心一言(ERNIE Bot)、通义千問(Tongyi Qianwen)、Minimax、ZHIPU(ChatGLM)が含まれます。
  2. Embedding大モデル:知識ベースのドキュメントのセグメンテーションエンコーディングとユーザーの質問処理に使用されます。サポートしているサプライヤーにはOpenAIとZHIPU(ChatGLM)、およびJina AI(Jina Embeddings)が含まれます。
  3. Rerank大モデル:LLMの検索結果を最適化するために使用されます。サポートしているサプライヤーにはCohereとJina AI(Jina Reranker)が含まれます。
  4. 音声からテキストへの変換大モデル:音声をテキストに変換するために使用されます。サポートしているサプライヤーにはOpenAIが含まれます。
  5. テキスト読み上げ大モデル:もう言うまでもない。

モデルサプライヤータイプ

モデルサプライヤーは二種類に分かれる:

  • 自社モデル:自社で開発したモデルを提供する、例えばOpenAIとAnthropic。
  • ホスティングモデル:サードパーティのモデルを提供する、例えばHugging FaceとReplicate。

接続方法

  • 自社モデルサプライヤー:対応するサプライヤーのAPI Keyを設定すると、Difyは自動的にそのサプライヤー下のすべてのモデルに接続する。
  • ホスティングモデルサプライヤー:接続方法は少し異なり、具体的なサプライヤーの要求に従って設定する必要がある。

安全対策

Dify は PKCS1_OAEP 暗号技術を使用してユーザーが管理する API キーを保存し、各テナントには独立したキーペアが割り当てられ、API キーの安全性を確保し、漏洩を防止します。

デフォルトモデルの設定

Dify はモデルが必要な場合、使用シナリオに基づいて設定されたデフォルトモデルを選択します。デフォルトモデルは 设置 > 模型供应商 で設定します。

モデルの接続設定

Dify の 设置 > 模型供应商 で接続するモデルを設定します。システムデフォルト推論モデル(System Reasoning Model):アプリケーションの作成に使用するデフォルトの推論モデルを設定し、会話名の生成、次の質問の提案などの機能もこのデフォルトの推論モデルを使用します。

モデルの使用

モデルの設定が完了したら、アプリケーションでこれらのモデルを使用できます:

Difyのワークショップでアプリケーションを作成する方法は3種類あります:

  • アプリテンプレートに基づいて作成(初心者のおすすめ)
  • 空白のアプリケーションを作成
  • DSLファイル(ローカル/オンライン)を使用してアプリケーションを作成


テンプレートからアプリケーションを作成

Difyを初めて使用する際、アプリケーションの作成についてあまり知識がないかもしれません。初心者ユーザーがDifyでどのような種類のアプリケーションを構築できるかを迅速に理解するために、Difyチームのプロンプトエンジニアが複数のシナリオで高品質なアプリケーションテンプレートを作成しています。

「ワークショップ」を選択してナビゲーションし、アプリケーションリストから「テンプレートから作成」を選択できます。


テンプレートからアプリケーションを作成

任意のテンプレートを選択し、それをワークスペースに追加します。


新しいアプリケーションを作成

Dify 上で空白のアプリを作成する必要がある場合は、「スタジオ」を選択し、アプリリスト内で「空白から作成」を選択してください。

Dify では、チャットアシスタント、テキスト生成アプリ、Agent、ワークフローという 4 種類の異なるアプリタイプを作成できます。

アプリを作成する際には、アプリに名前をつけ、適切なアイコンを選択するか、お気に入りの画像をアップロードしてアイコンとして使用し、アプリの用途を明確な文章で説明する必要があります。これにより、後でチーム内でアプリが利用できるようになります。

チャットアシスタント

対話型アプリは、一問一答の形式でユーザーと継続的に会話を行います。

アプリの作成

ホームページで「アプリを作成」ボタンをクリックしてアプリを作成します。アプリの名前を入力し、アプリの種類としてチャットアシスタントを選択します。

アプリの構成

アプリを作成すると自動的にアプリの概要ページに移動します。左側のメニューで「編成」をクリックしてアプリを編成します。

プロンプトを入力

プロンプトはAIが専門的な回答を提供するのを制約し、応答をより正確にするために使用されます。組み込みのプロンプト生成器を利用して適切なプロンプトを書くことができます。プロンプト内でフォーム変数を挿入することができ、例えば{{input}}のようにします。プロンプト内の変数の値はユーザーが入力した値に置き換えられます。
例:

  1. プロンプト指令を入力し、面接シナリオのプロンプトを作成します。
  2. 右側のコンテンツボックスが自動的にプロンプトを生成します。
  3. プロンプト内にカスタム変数を挿入することができます。


より良いユーザーエクスペリエンスのため、会話のオープニングフレーズを追加することができます:你好,{{name}}。我是你的面试官,Bob。你准备好了吗?。ページの下部にある「機能を追加」ボタンをクリックして、「会話のオープニングフレーズ」の機能を開きます。


プロンプトを編集する際、複数のプロンプト質問を追加することもできます:

コンテキストの追加

AIの会話範囲を知識ベース内に限定したい場合、例えば企業内のカスタマーサービスのフォーマット,コンテキスト内で知識ベースを参照できます。

ファイルアップロードの追加

一部の多モーダルLLMはファイル処理をネイティブにサポートしています。例えばClaude 3.5 SonnetGemini 1.5 Proです。ファイルアップロードのサポート状況については、LLMの公式サイトで確認できます。
ファイルを読み取るLLMを選択し、「ドキュメント」機能を有効にします。複雑な設定なしで、現在のChatbotにファイル認識能力を付与できます。

デバッグ

右側にユーザー入力項目を入力し、内容をデバッグします。


LLMが提供する回答結果が不適切な場合、プロンプトを調整したり、異なる底层モデルを切り替えて効果を比較したりできます。さらに詳細な操作が必要な場合は、多モデルデバッグを参照してください。

アプリの公開

アプリをデバッグした後、右上角の「公開」ボタンをクリックして独立したAIアプリを生成します。公開URLを通じてアプリを体験するだけでなく、APIベースの二次開発やウェブサイトへの埋め込みなども可能です。詳細は公開を参照してください。

Agentスマートアシスタント

スマートアシスタント(Agent Assistant)は、大言語モデルの推論能力を活用し、複雑な人間のタスクに対して目標計画、タスク分割、ツール呼び出し、プロセス反復を行い、人間の介入なしでタスクを完了することができます。

簡単に迅速に利用できるように、スマートアシスタントのアプリケーションテンプレートを「探索」で見つけ、自分のワークスペースに追加したり、その基礎にカスタマイズすることもできます。全新的なDifyスタジオでは、ゼロから自分専用のスマートアシスタントを構築し、財務報告分析、レポート作成、ロゴデザイン、旅行計画などのタスクを支援できます。


スマートアシスタントの推論モデルを選択し、スマートアシスタントのタスク完了能力はモデルの推論能力に依存します。スマートアシスタントを使用する際には、より高い推論能力を持つモデルシリーズ(例えばdeepseek)を選択することをお勧めし、より安定したタスク完了効果を得ることができます。


あなたは「プロンプト」でインテリジェントアシスタントの指示を記述できます。より良い結果を得るために、指示の中でそのタスクの目標、作業フロー、リソースや制限などを明確にすることができます。

必要なツールを追加

「コンテキスト」で、インテリジェントアシスタントが参照できる知識ベースのツールを追加できます。これにより、外部の背景知識を得ることができます。
「ツール」で、使用するツールを追加できます。ツールはLLMの能力を拡張し、例えばインターネット検索、科学計算、画像の描画など、LLMが外部世界とつながる能力を与え、強化します。Difyは2種類のツールタイプを提供しています:ファーストパーティツールとカスタムツール。
Difyのエコシステムが提供するファーストパーティの組み込みツールを直接使用することもできますし、カスタムAPIツールを簡単にインポートすることもできます(現在はOpenAPI / SwaggerとOpenAI Plugin規範をサポートしています)。

「ツール」機能は、ユーザーが外部の能力を活用して、Dify上でより強力なAIアプリケーションを作成できるようにします。例えば、インテリジェントアシスタント型アプリケーション(Agent)に適切なツールを編成することができ、タスクの推論、ステップの分割、ツールの呼び出しを通じて複雑なタスクを完了できます。
また、ツールはあなたのアプリケーションを他のシステムやサービスに簡単に接続し、外部環境とやり取りすることができます。例えば、コードの実行、専用情報源へのアクセスなどです。必要なツールの名前を対話窓で言及するだけで、自動的にそのツールが呼び出されます。


Agentの設定

Dify上では、インテリジェントアシスタントにFunction calling(関数呼び出し)とReActの2種類の推論モードを提供しています。Function Callをサポートしているモデル系列(gpt-3.5/gpt-4)は、より良い効果と安定した性能を提供し、Function callingをサポートしていないモデル系列については、ReAct推論フレームワークを通じて似たような効果を実現しています。
エージェントの設定で、アシスタントの反復回数の制限を変更できます。


関数呼び出しモード

ReAct モード

会話のオープニングメッセージを設定
あなたは、インテリジェントアシスタントに会話のオープニングメッセージとオープニング質問を設定できます。設定された会話のオープニングメッセージは、ユーザーが初めて会話するときに、アシスタントがどのようなタスクを実行できるか、およびどのような質問を例示できるかを表示します。


ファイルアップロードの追加

一部の多モーダルLLMは、Claude 3.5 SonnetGemini 1.5 Proのようにファイルを処理するのをネイティブにサポートしています。
ファイルを読み取るLLMを設定し、「ドキュメント」機能を有効にします。複雑な設定なしで、現在のChatbotにファイル認識能力を付与できます。

スマートアシスタントの構築が完了したら、アプリケーションを公開する前にデバッグとプレビューを行い、アシスタントのタスク完了結果を確認できます。


デバッグとプレビュー

スマートアシスタントの構築が完了したら、アプリケーションを公開する前にデバッグとプレビューを行い、アシスタントのタスク完了結果を確認できます。

アプリケーション公開

アプリケーションツールボックス

「スタジオ -- アプリケーション構築」で「機能を追加」をクリックして、アプリケーションツールボックスを開きます
アプリケーションツールボックスはDifyのアプリケーションにさまざまな付加機能を提供します:

会話のオープニングフレーズ

対話型アプリケーションにおいて、AIは最初の言葉を発したり質問を提案したりします。開始時の挨拶の内容を編集して、開始時の質問を含めることができます。対話の開始挨拶を使用すると、ユーザーに質問を導き、アプリケーションの背景を説明し、対話の質問の使用ハードルを下げることができます。

次の質問の提案

次の質問の提案を設定すると、対話の各インタラクションの後に、AIが以前の対話内容に基づいて次の3つの質問を生成し、次の対話を導くことができます。

テキストから音声への変換TTS

オンにすると、AIの返信内容を自然な音声として再生できます。

音声からテキストへの変換ASR

オンにすると、アプリケーション内で録音し、音声を自動的にテキストに変換できます。

引用と帰属

機能を有効にすると、LLMが知識ベースの内容を参照して質問に答える際、返信内容の下に具体的な参照段落情報が表示されます。これには元の段落テキスト、段落番号、マッチング度合いなどが含まれます。
詳しい説明は引用と帰属を参照してください。

コンテンツ審査

AIアプリケーションとインタラクションする際、コンテンツの安全性、ユーザーエクスペリエンス、法規制などに対して厳しい要件が課されることがよくあります。そのような場合には、「敏感コンテンツ審査」機能を利用して、エンドユーザーにより良いインタラクション環境を提供する必要があります。
詳しい説明は敏感コンテンツ審査を参照してください。

返信に注釈を付ける

ラベル返信機能は、人工による編集でラベル付けされ、アプリケーションにカスタマイズ可能な高品質な質問への返信能力を提供します。

ワークフロー


基本紹介

ワークフローは、複雑なタスクを小さなステップ(ノード)に分割することでシステムの複雑さを低減し、プロンプト技術やモデル推論能力への依存を減少させ、LLMアプリケーションが複雑なタスクに対応する性能を向上させ、システムの説明可能性、安定性、耐错性を向上させます。
Dify ワークフローは、2つのタイプに分けられます:

  • Chatflow:対話シナリオ向けで、顧客サービス、意味検索、他に応答を構築する際に複数の論理ステップが必要な対話型アプリケーションを含みます。
  • Workflow:自動化とバッチ処理シナリオ向けで、高品質な翻訳、データ分析、コンテンツ生成、メール自動化などのアプリケーションに適しています。


は、自然言語入力におけるユーザーの意図認識の複雑さを解決するために、Chatflowは問題理解クラスのノードを提供しています。Workflowに対して、Chatbotの特性をサポートする機能が追加され、例えば:会話履歴(Memory)、ラベル付き返信、Answerノードなどです。
は、自動化やバッチ処理シナリオにおける複雑なビジネスロジックを解決するために、ワークフローは豊富なロジックノードを提供しており、例えば:コードノード、IF/ELSEノード、テンプレート変換、反復ノードなどです。これに加えて、タイマーとイベントトリガーの機能も提供され、自動化フローを構築するのに便利です。

一般的な事例

  • カスタマーサービス

LLMをあなたのカスタマーサービスシステムに統合することで、一般的な質問を自動的に回答し、サポートチームの負担を軽減できます。LLMは、顧客のクエリの文脈と意図を理解し、リアルタイムで有益で正確な返信を生成できます。

  • コンテンツ生成

ブログ記事の作成、製品説明、マーケティング資料の作成が必要であれ、LLMは高品質なコンテンツを生成してあなたをサポートします。大まかな構成やテーマを提供するだけで、LLMは広範な知識ベースを活用して魅力的で、情報豊富で、構造的な良いコンテンツを作成します。

  • タスクの自動化

は、Trello、Slack、Larkなどのさまざまなタスク管理システムと統合でき、プロジェクトとタスクの管理を自動化します。自然言語処理を利用することで、LLMはユーザーの入力を理解し解釈し、タスクを作成し、ステータスを更新し、優先順位を割り当て、手動の介入なしで行います。

  • データ分析とレポート

は、大規模な知識ベースを分析し、レポートや要約を生成するために使用できます。LLMに関連情報を提供することで、トレンド、パターン、洞察を識別し、原始データを実行可能な知恵に変換できます。データ主導の意思決定を望む企業にとって、これは特に価値があります。

  • メールの自動処理

LLM はメールの草稿作成、ソーシャルメディアの更新、その他のコミュニケーション形式に使用できます。要点や簡潔な構成案を提供することで、LLM は構造良好で一貫性があり、文脈に沿った情報を生成することができます。これにより、多くの時間を節約し、返信が明確で専門的であることを保証できます。

重要概念


ノード
ノードはワークフローの重要な構成要素であり、異なる機能を持つノードを接続することで、ワークフローの操作を一連に行います。
ワークフローの核心的なノードはこちらをご覧くださいノードの説明


変数
変数は、ワークフロー内の前後のノードの入力と出力を連携させ、プロセス内の複雑な処理ロジックを実現します。システム変数、環境変数、セッション変数を含みます。


Chatflow

適用シーン:
対話形式の状況に向けたもので、顧客サービス、意味検索、他に応答を構築する際に多段階の論理を必要とする対話型アプリケーションを含みます。この種類のアプリケーションの特徴は、生成された結果に対して複数のラウンドで対話的インタラクションを行い、生成された結果を調整することをサポートしている点です。
一般的なインタラクションパス:指示を与える → 内容を生成 → 内容について複数回議論 → 再度結果を生成 → 終了

ワークフロー(Workflow)

適用シーン:
自動化とバッチ処理の状況に向けたもので、高品質な翻訳、データ分析、コンテンツ生成、電子メール自動化などのアプリケーションに適しています。この種類のアプリケーションでは、生成された結果に対して複数のラウンドで対話的インタラクションを行うことはできません。
一般的なインタラクションパス:指示を与える → 内容を生成 → 終了


アプリケーションタイプの違い

  1. End ノードはワークフローの終了ノードに属し、プロセス終了時にのみ選択可能です。
  2. Answer ノードはChatflowに属し、流式でテキストコンテンツを出力し、プロセスの中間ステップでの出力にも対応しています。
  3. Chatflowには組み込みのチャット記憶(Memory)があり、複数の対話の歴史メッセージを保存・伝達するために使用されます。LLM問題分類などのノード内で有効にすることができ、ワークフローにはMemory関連の設定がなく、有効にすることができません。
  4. Chatflowの開始ノードには組み込みの変数としてsys.querysys.filessys.conversation_idが含まれます。sys.user_id。ワークフローの開始ノードに組み込まれた変数には:sys.filessys.user_idが含まれます。

ワークフローを構築

一、ワークフローを作成

ここでは、空白のアプリケーションを作成し、ワークフローを選択します:

任意の名前をつけ、作成をクリックして作成完了です。

二、プロセスノードを作成

次に、プロセスノードを作成します。前のステップで作成が完了すると、自動的にプロセスノードのキャンバスが表示され、開始ボタンも表示されます:

ここでは、上記の手順に従います。

1)タイトルのヒントメッセージを設定し、内容のヒントメッセージを設定します。

スタートボタンをクリックし、2つの入力値を設定します。1つはタイトルのヒントメッセージで、もう1つはコンテンツのヒントメッセージです:

作成が完了すると、パネルに2つのフィールドが追加されたことを確認できます。

2)AIを使用してタイトルを生成

前のステップのパネルの「次へ」の位置に、

LLMモデルを追加します:

ここでは多くの選択肢がありますが、必要に応じて選んでください。ここではモデルを使用してタイトルを生成する必要があるため、LLMを選択します。追加後、ノードにLLMが追加されたことを確認できます:

ここでLLMテンプレートを設定します:

上記の4つの部分の情報を設定するだけでよいです。ここで説明します:

BASIC

1、system部分其实就是我们给ai的提示语,也就是给他场景和要求。
2、user部分主要是作为用户传递的一些特定指向的注释信息。

3)AIを使用して本文を生成

その後、アピール2の場所で、さらに次の位置にLLMを追加し、本文を生成するために使用します:

4)タイトルと本文を統合

ここで、アピール3のパネルで「次へ」を選択し、前のタイトルと内容を抽出するためのテンプレート変換を追加します。内容は自分で編集する必要があります:

5)プロセスを終了

ここで、アピール4のパネルに次のノードとして「終了」を追加し、出力情報を設定します:

ここまでで、私たちの全体のプロセスが作成完了です。キャンバスには完全なプロセスが表示されます:

三、テストの実行

プロセスが指定された後、実行ボタンを選択してテストを行います:

実行をクリックすると、タイトルと本文の入力を求めるプロンプトが表示されます(下図参照):

皆様は自分のニーズに合わせて記入を行ってください。記入が完了したら、「開始実行」をクリックし、少し待つと結果が表示されます:

以上はDifyでワークフローを使用する場合の例です。上記は主にデモンストレーションであり、詳細な説明は行われていません。ここではご自身のニーズに合わせてカスタマイズできるため、一括りに説明するものではなく、基本的な要素はここで指摘します:

1. ワークフローを使用する前提として、一つの事を分割し、各ステップを繋げることができます。

2. AIを有効にする場合はLLMノードを選択し、他の処理を行う場合は他のノードを選択します。

3. AIの精度はあなたのプロンプトによって決まり、System部分の記述をできるだけ詳細に記述することが重要です。

4. すべてのプロンプトはインターネットで検索できます。

知識ベースの使用

一、知識ベースの準備
ここで準備する知識ベースの形式はほぼ制限なしで、一般的にチャットシナリオの場合はQA形式を選択することが多いです。例えば、カスタマーサービスのセリフは非常に適しています。そこで、私はネット上でカスタマーサービスに関連する用語をいくつか見つけました。内容は以下の通りです:

### 新しいプロジェクトを作成する方法? 新しいプロジェクトを作成するには、「新しいプロジェクト」ボタンをクリックし、プロジェクト名を入力し、テンプレート(あれば)を選択して「作成」をクリックします。プロジェクトはあなたのプロジェクトリストに表示されます。 ### タスクに締め切りを追加する方法? タスクの詳細ページで、締め切り日付の領域をクリックし、日付を選択して保存します。タスクの締め切り日付はタスクリストに表示されます。 ### Googleカレンダーと同期する方法? 「設定」ページに進み、「統合」オプションを探し、「Googleカレンダー」を選択し、指示に従って認証と同期を行います。同期後、すべてのプロジェクトタスクの締め切り日付があなたのGoogleカレンダーに表示されます。 ### タスクに優先度を設定できますか? はい、タスクの詳細ページでタスクの優先度を設定できます。「優先度」ドロップダウンメニューから「高」「中」または「低」を選択します。設定後の優先度はタスクリストに表示されます。 ### どのようにしてアカウントのメールアドレスを変更するか? 「アカウント設定」ページに進み、「個人情報」セクションでメールアドレスの横にある「編集」ボタンをクリックし、新しいメールアドレスを入力して保存します。変更を完了するには、新しいメールアドレスで検証する必要があります。 ### パスワードを忘れた場合、どうすればいいですか? ログインページで「パスワードを忘れた」リンクをクリックし、登録メールアドレスを入力します。私たちはリセットパスワードのリンクをあなたのメールアドレスに送信します。そのリンクを通じて新しいパスワードを設定できます。 ### チームメンバーをプロジェクトに招待する方法? プロジェクトページで「メンバーを招待」ボタンをクリックし、招待するメンバーのメールアドレスを入力し、彼らの役割(管理者、編集者など)を選択します。「招待を送信」をクリックすると、相手は招待メールを受け取ります。 ### どのようにしてサブスクリプションプランを確認するか? 「アカウント設定」ページに進み、「サブスクリプション」セクションで現在のサブスクリプションプラン、次の請求日、および費用の詳細を確認できます。 ### サブスクリプションプランをアップグレードする方法? 「アカウント設定」の「サブスクリプション」セクションで「プランをアップグレード」ボタンをクリックし、アップグレードしたいプランを選択して支払いを確認します。アップグレードはすぐに有効になり、費用は比例して計算されます。 ### サブスクリプションをキャンセルできますか? はい、いつでもサブスクリプションをキャンセルできます。「アカウント設定」の「サブスクリプション」セクションで「サブスクリプションをキャンセル」ボタンをクリックし、指示に従ってキャンセル操作を完了します。サブスクリプションをキャンセルした後も、有料機能は現在の請求周期終了まで使用できます。 ### タスクリストが表示されない場合、どうすればいいですか? 正しいプロジェクトを選択しているか確認してください。サイドバーのプロジェクトリストでプロジェクトを再選択できます。問題が解決しない場合は、ページをリフレッシュするか、ログアウトして再ログインしてみてください。 ### なぜ通知メールを受け取れないのですか? 通知設定を確認し、関連する通知オプションが有効になっているか確認してください。有効にしても受け取れない場合は、スパムフォルダを確認し、私たちのメールアドレスを連絡先に追加してください。 ### システムが「操作に失敗しました」と表示される場合、どうすればいいですか? これはネットワークの問題が原因일 수 있습니다。あなたのネットワーク接続を確認して再試行してください。問題が解決しない場合は、カスタマーサービスに連絡し、関連するエラーアイテムとスクリーンショットを提供してください。 ### システム更新後に一部のデータが失われた場合、どうすればデータを復元できますか? システム更新後にデータが失われた場合は、すぐにカスタマーサービスに連絡してください。私たちはシステムバックアップを使用して失われたデータを復元するのを手伝いますが、問題が発生した後24時間以内に連絡することをお勧めします。 ### ソフトウェアのバグを報告する方法? ソフトウェアのバグを見つけたら、「ヘルプセンター」に進み、「問題を報告」をクリックし、「セキュリティ上の脆弱性」を選択して関連情報を記入してください。私たちの技術チームはできるだけ早く対応します。 ### プロジェクトが読み込まれない場合、どうすればいいですか? まず、あなたのネットワーク接続を確認し、他のデバイスでアクセスを試みてください。問題が解決しない場合は、ブラウザのキャッシュをクリアするか、別のブラウザを使用してみてください。問題が解決しない場合は、カスタマーサービスに連絡してください。


ここに空のファイルを作成し、上記の内容をコピーして保存します。保存するファイル名は「客服知识问答语料库.md」です。下図の通りです:

二、知识库の追加

次にDifyのダッシュボードにアクセスし、上記の知识库を探して、知识库を作成を選択します:


既存のテキストをインポートを選択します(他の二つのオプションであるnationとwebサイトは後で説明します)。先ほどの「客服知识问答语料库.md」をアップロードします


次に「次へ」をクリックします

ここではほぼデフォルトの設定を保持しますが、注意点があります:
1)インデックス方法
通常は「経済的」を選択します。これは無料で利用できます。「高品質」を選択する場合は、openaiを使用する必要があり、費用がかかります。したがって、無料の場合は「経済的」を選択してください。
2)検索設定

ここではデフォルトで3が設定されており、後で実際の状況に応じて調整できます

最後に保存して処理します

保存すると、知識ベースの下に先ほど追加した情報が表示されます

三、知識ベースの使用
知識ベースを追加した後、それを使う必要があるので、ここでは先ほど作成したチャットボットに戻り、入っていきます


上の図のように、コンテキストが表示されており、「追加」を選んで先ほどの知識ベースを追加します


追加した後、右側でデバッグとプレビューを行えます

先ほどの知識ベースに近いトピックについて質問します。例えば:「Google Calendarの同期はどうやって行うか?」

少々お待ちください、その回答結果を見てみましょう:


はここでの回答がカスタマーサービス用語とほぼ一致していることがわかります。Dify上で追加された知識ベースがモデルによって認識され使用されていることを示しています。最後に、このモデルを公開します:


公開後、すべてのチャットが現在の知識ベースに基づいて照合・参照されるようになります。

注記:
1、特定の業界において、知識ベースの精度が高いほど、AI大規模モデルの参照回答がより良いになります。もし知識ベースの内容が悪い場合、AI大規模モデルの参照回答も非常に悪くなります。

上記の記事によると、皆さんは垂直業界でビジネスを展開できるようになったのでしょうか?

職場はゲームの一種ですが、ゲームは人生の全部ではありません。目の前の得をこだわらず、もっと不安に縛られないようにしましょう。自分自身にさらに底力を蓄えようと努めてください。将来、あなたは今の自分を感謝するでしょう。なぜなら、その時、あなたは人生の主導権をようやく自分の手に収めたことに気づくからです。

付録2:ローカルDifyのデプロイ

本稿では、Difyのデプロイとインストール、および前回の大規模モデルとの連携をデモンストレーションします。

一、Docker環境のインストール

Difyのインストールは簡単です。Dockerで直接起動するだけなので、まずはサーバー上にDocker環境とDocker Compose環境があることを確認する必要があります。

Dockerのインストールについては、《docker》を参照してください。

Docker Composeのインストールについては、《docker-composeインストール》を参照してください。

二、Difyソースコードのクローン

Difyはオープンソースのコードであるため、GitHubからそのコードをローカルにクローンする必要があります:

コマンドを入力します;

git clone https://github.com/langgenius/dify.git 

下図のように:

三、Difyの起動

次にDifyを起動します。dify/dockerディレクトリに移動すると、対応するdocker-compose.ymlファイルが見つかります

以下のコマンドを実行して起動します

#拷贝env文件
cp -r middleware.env.example .env

#执行环境
. .env

#启动dify
docker-compose up -d

少し待って、Difyが起動が完了します

起動が完了した後、docker psを使用して10つのdockerインスタンスが実行されていることが確認できます

四、Difyのアクセス

次にブラウザでDifyにアクセスできます。サーバーのIPアドレスを入力しますhttp://128.0.0.1またはlocalhost。ポートはデフォルトの80です。初めてアクセスする際には管理者アカウントを設定する必要があります:

設定後、ログインページにリダイレクトされます。先ほど設定した管理者情報を入力してアクセスできます:

五、Qwen3-8Bの統合

次に、qwen3-8b大モデルを継承する必要があります。まずDifyのダッシュボードにアクセスし、右上のアバターをクリックすると設定ボタンが見つかります:

設定ボタンをクリックし、モデルサプライヤーを選択します。ここでは、前にローカルでデプロイしたollamaを追加するため、ollamaを選択します:

ここに入力する情報は以下の通り

模型名称:填写 qwen3:8b

ここでモデル名を任意に記入することはできません。サーバー上で実行されている名前を記入する必要があります。下の図を参照してください

他に名前を書くと、ollamaの設定で404が表示され、「見つかりません」というエラーメッセージが表示されるため、ここでは注意が必要です。入力する名前が実行するモデルの名前であり、文字列は完全に一致する必要があります。

基础URL: 这里填写服务器的ip+11434端口即可,例如:http://192.168.1.129:11434
如果ollama在本地,那就是127.0.0.1或者localhost

ここでは必ず接頭辞を追加してくださいhttp://ip、ポートは11434です。前で11434ポートを0.0.0.0/0アクセスに変更しておきました。

残りの情報はすべてデフォルトのままに留めることができます。私のここでの入力例は以下の通りです:

最後に保存をクリックします。

次に、アプリケーションの作成の段階です。チャットアシスタントを選択し、空白のアプリケーションを作成します

名前と説明を入力し、作成をクリックするとチャットアシスタントアプリケーションにアクセスできます:

その後、右上に先ほど追加したqwen3:8bモデルが表示されます:

右上角の小窓の上の投稿ボタンをクリックしてください

チャット画面に進み、チャットできます。例は以下の通りです:

とても便利ですね。

特に注意してほしいのは、ここでの応答速度はサーバーの設定によって決まります。例えば、私たちは8コア16ギガバイトの設定を使用しており、質問をする際にはCPUが完全にフルに動作し、回答も非常に長い時間待ちました。

それ以上が、私たちがdifyを使用してローカルデプロイのqwen3:8b大モデルを統合したケースです。後で、ローカル知識ベースの統合などのケースについて順番にご紹介し、業務シナリオにより適合させる予定です。

付録2:Dify公式ワークフロー事例14を解体

SEOブログ記事生成器(SEO Blog Generator)

感情分析(Sentiment Analysis)

ユーザーレビュー分析ワークフロー(Customer Review Analysis Workflow)

メールアシスタントワークフロー(Email Assistant Workflow)

テキスト要約ワークフロー(Text Summarization Workflow)

長編物生成ワークフロー(Long Story Generator)

三段階翻訳ワークフロー(Three-Step Translation Workflow)

本翻訳ワークフロー(Book Translation)

Jina Readerを使用したウェブサイト要約(Summarize website with Jina Reader)

ウェブコンテンツ検索と要約ワークフロー(Web Content Search and Summarization Workflow)

Difyワークフローハルパー(Workflow Planning Assistant)

質問分類器 + 知識 + チャットボット(Question Classifier + Knowledge + Chatbot)

知識検索チャットボット(Knowledge Retreival + Chatbot)

メール自動返信ワークフロー(Automated Email Reply)

Dify.AI のリソース:

  • 開発ツール:Prompt IDE とさまざまな API を含め、生成型 AI アプリケーションの開発と統合に使用されます。
  • ドキュメントとサポート:詳細なドキュメントと技術サポートを提供し、開発者が迅速に導入して問題を解決できるように支援します。

コミュニティとエコシステム:開発者コミュニティ、パートナー、エコシステムを含む可能性があり、知識の共有と協力を促進します。