惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

E
Exploit-DB.com RSS Feed
Cyber Security Advisories - MS-ISAC
Cyber Security Advisories - MS-ISAC
Engineering at Meta
Engineering at Meta
Recent Announcements
Recent Announcements
Forbes - Security
Forbes - Security
有赞技术团队
有赞技术团队
Recent Commits to openclaw:main
Recent Commits to openclaw:main
Webroot Blog
Webroot Blog
U
Unit 42
cs.CV updates on arXiv.org
cs.CV updates on arXiv.org
Jina AI
Jina AI
C
CXSECURITY Database RSS Feed - CXSecurity.com
P
Privacy International News Feed
K
KPMG report finds enterprise disconnect between AI and its ROI | CIO
C
Cisco Blogs
H
Heimdal Security Blog
AI
AI
Schneier on Security
Schneier on Security
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
博客园 - 司徒正美
WordPress大学
WordPress大学
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
D
Docker
H
Hacker News: Front Page
小众软件
小众软件
B
Blog RSS Feed
Google DeepMind News
Google DeepMind News
博客园 - 聂微东
月光博客
月光博客
Security Latest
Security Latest
云风的 BLOG
云风的 BLOG
N
News and Events Feed by Topic
酷 壳 – CoolShell
酷 壳 – CoolShell
F
Fortinet All Blogs
The Register - Security
The Register - Security
L
LangChain Blog
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
博客园 - 叶小钗
阮一峰的网络日志
阮一峰的网络日志
C
Check Point Blog
Hacker News - Newest:
Hacker News - Newest: "LLM"
SecWiki News
SecWiki News
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
大猫的无限游戏
大猫的无限游戏
美团技术团队
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
量子位
C
Cyber Attacks, Cyber Crime and Cyber Security
The Cloudflare Blog
S
Schneier on Security

博客园_首页

Linux实操--组管理、权限管理和定时任务 Java + EasyExcel 实现单个接口导出多个Excel Mem0 源码解析系列(二):提示词工程的深度剖析 Openclaw TaskFlow究竟是什么?和普通Skill技能有什么区别 博文阅读密码验证 - 博客园 嘉立创开源:应该是全网MicroPython教程最多的开发板 Hermes Agent 集成实践:从协议到生产 2026年AI编程工具横评:Cursor、Codex、Claude Code、Zed、Windsurf Java程序员必看的RAG入门教程 2026 AI效率神器:Superpowers + Claude Code 保姆级教程 本地大模型部署全攻略:从 0 到 1 玩转 Ollama 【从0到1构建一个ClaudeAgent】内存管理-上下文压缩 .NET 高级开发 | 设计、实现一个事件总线框架 电子小白入门之NE555 3. WorkBuddy:隐藏玩法,一键召唤专家,让 AI 以"专家身份"给你干活 和AI一起搞事情#3:Claude Teammate 游戏开发翻车实录 【OpenClaw】通过 Nanobot 源码学习架构---(7)Memory C# .NET 周刊|2026年3月3期 我在 Debian 11 上把 K8s 单机搭起来了,过程没你想的那么顺(/opt 目录版) 深度学习进阶(七)Data-efficient Image Transformer CLI+Skill搭建浏览器AI自动化框架,告别一切重复枯燥任务 告别Token账单无底洞:OpenClaw本地部署,重塑企业数据主权的唯一解 FastAPI+Vue:文件分片上传+秒传+断点续传,这坑我帮你踩平了! SBTI 爆火后,我做了个程序员版的 CBTI。。已开源 + 附开发过程 多模态检索开始进入工程期:用 Sentence Transformers 搭建可落地的 Multimodal RAG 100多行代码实现一个最简单的Agent(用ReAct) Claude Code 通关手册(八):推荐 5 个 Hooks,代码质量提升 3 倍 老板:“有人截图了!”。安全部门:“收到,马上查暗水印!” - why技术 技术之外,皆是人间 C#/.NET/.NET Core技术前沿周刊 | 第 69 期(2026年4.01-4.12) Snack JSONPath 项目架构分析 Claude Code Buddy 小析:一个非核心功能,如何体现产品的细节完成度 AI新时代下的图床管理方案-Cloudflare图床+MCP+Skills方案指南 化繁为简:顺丰速运App如何通过 HarmonyOS SDK实现专业级空间测量 从零实现富文本编辑器#13-React非编辑节点的内容渲染 AI开发-python-langchain框架(3-23-OpenAI Functions风格Tool Calling智能助手) .NET + AI 进阶实战:基于类的技能开发 - 打造可治理的 Agent 能力模块 【从0到1构建一个ClaudeAgent】规划与协调-技能 上周热点回顾(4.6-4.12) 电子小白的工具三件套:面包板、杜邦线、万能板 单表五亿数据的查询优化 | Mysql、StarRocks 2. WorkBuddy:从“我是谁”到“帮我干活” C# 如何减少代码运行时间:7 个实战技巧 基于HelixToolkit.SharpDX 渲染3D模型 - 笺上知微 从零开始的双臂具身VLA起源及现阶段发展综述 - SkyXZ 记对 xonsh shell 的使用, 脚本编写, 迁移及调优 - pluvium27 受够了Vibe Coding的失控?换个起点,让AI事半功倍 从开始配置漏洞环境到漏洞复现流程 - 難しい 关于10年工作经验的程序员对OpenClaw的实战经验分享以及看法 - 虚无境 Any metadata 的内存布局 C# .NET 周刊|2026年3月2期 - InCerry 我帮你测过了,测试圈排名第二的 Skill 依然很牛逼 Skill Discovery | 无监督技能发现的经典工作总结 - MoonOut PbootCMS 网站内容数量多导致访问慢?这些实用优化方案帮你提速! - 家兴网络技术工作室 上下文工程是什么?过时了么?一文讲明白! - 一枫说码 网站漏洞怎么发现并修复?一篇实用指南(附完整流程) - 家兴网络技术工作室 开了 TUN 模式还是直连?90% 的人都踩过这个坑 Github日报|2026年04月12日 - AI一族 AScript扩展多种脚本语言 - rockey627 AI 学习笔记:Agent 的记忆机制 你能被装进一个文件里吗?——7 万人把同事"蒸馏"成了 AI - 我没有三颗心脏 Claude Code 通关手册(七):给 AI 装上技能包——Skills 完全指南 - 暮色之狐 在浏览器中快速编辑代码:VSCode Web 集成实践 - Newbe36524 蒸馏自己 skill?基于 Deepseek 的蒸馏器,丐版蒸馏方式,简单便捷 - To_Carpe_Diem Spring AI Aliababa和AgentScope,哪个更好? - 苏三说技术 Etsy 把 1000 个 MySQL 分片迁进 Vitess:425TB 数据背后的真正问题不是性能,而是运维规模 MicroPython LVGL基础知识和概念:底层渲染与性能优化 - FreakStudio 数据库草图算法 Python 潮流周刊#146:CPython 引入 Rust 的进展 - 豌豆花下猫 最小生成树 - mofei1116 红日靶场七:从外网入口、容器逃逸到 AD 接管的完整利用链复盘 - YouDiscovered1t 分享四款开源且实用的 Kafka 管理工具 - 追逐时光者 vLLM 权重加载机制全解析:从挑战到理想架构 LCT 学习笔记 - ACehomoxue Avalonia UI 12.0.0 正式发布:架构演进和性能飞跃 - 张善友 当 AI Agent 把调用链拉长,延迟开始成为一门生意 conhost.exe 无法显示 U+2717 - 145a 太秀了,我把自己蒸馏成了 Skill!已开源 - 程序员鱼皮 ASP.NET Core 内存缓存实战:一篇搞懂该怎么配、怎么避坑 基于 Ghostty 带有分割标签页和为 Claude 编程设计的通知终端 - BugShare AI 焊死入口:教育的“操作系统级”重塑 - 郝hai 初级Java开发工程师使用sql脚本编写代码的过程是简单而且不糊涂 - CoderOilStation Claude Code通关手册(六):MCP协议完全指南 - 暮色之狐 边框灯光环绕动画特效实现指南 - Newbe36524 开源:子木蒸馏版的 SEO 审计工具 seo-audit-skill v1.0 我所理解的Python元模型 【从0到1构建一个ClaudeAgent】规划与协调-TodoWrite - 程序员Seven Claude 和 Codex 在审计 Skill 上性能差异探究 - ACai_sec AScript如何实现中文脚本引擎 - rockey627 【渗透测试】HTB Season10 Garfield 全过程wp - dynasty_chenzi Android 开发者为什么必须掌握 AI 能力?端侧视角下的技术变革 树状数组正确性证明 - AC-wyr 你的 AI 焦虑,可能比 AI 本身更危险——ATM 机没有消灭银行柜员,但恐慌消灭了你的判断力 - 我没有三颗心脏 一个拉胯的分库分表方案有多绝望?整个部门都在救火! - 冰河团队 动态规划入门必学之走方格问题 - Ofnoname PostgREST 与 PostgreSQL 角色权限配置全解析(生产级实践) - SheepDog1998 使用 UEFI 图形输出协议 GOP 在屏幕上显示图像的方法 - 阿源- Claude Code通关手册(五):组建你的AI专家团队,子代理系统 - 暮色之狐 一个程序员到架构师的催婚路之感悟(整整10年后的催婚相亲感悟) - MisterLip 用 Agent Skill 自动生成工作周报 - 赵康
[MAF预定义的AIContextProvider-01]TextSearchProvider——RAG在MAF中的实现
Artech · 2026-06-17 · via 博客园_首页

作为最核心的AIAgent,ChatClientAgent构建了一个管道与LLM交互。为了让管道的输出更符合我们的需求,有两个主要的途径:输入增强(Input Enhancement)和输出增强(Output Enhancement),前者通过通过改变输入让LLM返回更高质量的内容,后者则直接对LLM的输出进行加工处理。个注册的AIContextProvider组成的管道位于ChatClientAgent管道的中间件部分(前后分别是AIAgent中间件管道和ChatClient管道),是专门为输入和输出增强设计的。RAG(Retrieval-Augmented Generation)的本质是根据当前上下文检索相关内容来丰富LLM的输入,是典型的输入增强的典型应用场景,它通过TextSearchProvider这个预定义的AIContextProvider实现。

1. 利用TextSearchProvider实现RAG

在介绍TextSearchProvider的设计和实现原理之前,我们先通过一个简单的例子来演示一下在MAF中如何使用TextSearchProvider实现RAG。首先来如下一个没有RAG的例子:我们根据OpenAIClient创建了一个ChatClientAgent,并直接调用它来回答一个问题:2026年斯诺克世界赛冠军是谁?

using Azure.AI.Projects;
using dotenv.net;
using Microsoft.Extensions.AI;
using OpenAI;
using OpenAI.Responses;
using System.ClientModel;

DotEnv.Load();

var model = Environment.GetEnvironmentVariable("MODEL")!;
var apiKey = Environment.GetEnvironmentVariable("API_KEY")!;
var endpoint = Environment.GetEnvironmentVariable("OPENAI_URL")!;

var agent = new OpenAIClient(
    credential: new ApiKeyCredential(key: apiKey),
    options: new OpenAIClientOptions { Endpoint = new Uri(endpoint) })
    .GetResponsesClient()
    .AsAIAgent(model: model);
var response = await agent.RunAsync(message:"2026年斯诺克世界赛冠军是谁?");
Console.WriteLine(response.Text);

输出:

我目前**无法确定**2026年斯诺克世界锦标赛的冠军是谁。

原因是:
- 虽然按赛程来看,2026年世锦赛通常在**4月下旬至5月初**结束,但
- 我无法获取**实时或最新比赛结果**,而且不应在没有可靠数据的情况下猜测冠军。

你可以选择下面两种方式之一:
1. **如果你想要的是已产生的正式结果**:我可以告诉你去哪里快速核实(如世界斯诺克官网、BBC Sport、世界斯诺克巡回赛官方微博等)。
2. **如果你想要的是赛前或赛中的预测/分析**:我可以根据当时的世界排名、签表、球员状态,给你一个专业预测。

你是想问**“已经夺冠的是谁”**,还是**“你预测谁会夺冠”**?

由于知识固化的原因,LLM无法直接回答这个问题。解决这个问题有两种途径: 一种是通过工具(比如web-search)获取最新信息,另一种是通过RAG检索相关信息作为上下文来辅助LLM生成答案。下面我们通过TextSearchProvider来实现RAG:我们在调用AsAIAgent时,传入一个ChatClientAgentOptions对象,并将一个TextSearchProvider实例添加到AIContextProviders中。TextSearchProvider需要我们提供一个SearchAsync方法来实现具体的检索逻辑,我们让这个SearchAsync方法返回吴宜泽夺冠的一段新闻稿。

using Azure.AI.Projects;
using dotenv.net;
using Microsoft.Agents.AI;
using Microsoft.Extensions.AI;
using OpenAI;
using OpenAI.Responses;
using System.ClientModel;
using static Microsoft.Agents.AI.TextSearchProvider;

DotEnv.Load();

var model = Environment.GetEnvironmentVariable("MODEL")!;
var apiKey = Environment.GetEnvironmentVariable("API_KEY")!;
var endpoint = Environment.GetEnvironmentVariable("OPENAI_URL")!;

var textSearchProvider = new TextSearchProvider(searchAsync: SearchAsync);
var agent = new OpenAIClient(
    credential: new ApiKeyCredential(key: apiKey),
    options: new OpenAIClientOptions { Endpoint = new Uri(endpoint) })
    .GetChatClient(model: model)
    .AsIChatClient()
    .AsAIAgent(options: new ChatClientAgentOptions { AIContextProviders = [textSearchProvider] });


var response = await agent.RunAsync(message: "2026年斯诺克世界赛冠军是谁?");
Console.WriteLine(response.Text);

static Task<IEnumerable<TextSearchResult>> SearchAsync(string query, CancellationToken cancellationToken)
{
    if (query.Contains("2026") && query.Contains("斯诺克") && query.Contains("世界赛"))
    {
        var news = """
北京时间2026年5月5日,英国谢菲尔德克鲁斯堡剧院,决胜局最后一颗黑球落袋后,00后中国球员吴宜泽挥拳庆祝。18:17,吴宜泽击败肖恩·墨菲,拿下2026年斯诺克世锦赛冠军。
社交平台上,“吴宜泽夺冠”迅速登上热搜,不少球迷将这场胜利形容为“中国斯诺克新的接力时刻”。这是继2025年赵心童夺冠之后,中国选手再次问鼎这项赛事最高荣誉。这也是在经历2023年前后相关禁赛与争议事件后,中国球员重新回到世界顶级竞争序列的重要节点。
相比十多年前,丁俊晖在斯诺克领域的单点突破,中国近几年开始稳定涌现世界级斯诺克选手。从个体突破到群体崛起,这项运动在中国已经进入新的发展阶段。
""";
        var result = new TextSearchResult
        {
            RawRepresentation = news,
            SourceLink = "https://baijiahao.baidu.com/s?id=1864605028122769594",
            SourceName = "每日经济新闻",
            Text = news
        };
        return Task.FromResult<IEnumerable<TextSearchResult>>([result]);
    }
    else
    {
        return Task.FromResult<IEnumerable<TextSearchResult>>([]);
    }
}

输出:

2026年斯诺克世锦赛的冠军是**吴宜泽**。

他在北京时间 **2026年5月5日** 于英国谢菲尔德克鲁斯堡剧院举行的决赛中,击败了**肖恩·墨菲**,成功夺冠。这也是继2025年赵心童夺冠之后,中国选手连续第二年获得斯诺克世锦赛冠军。

2. 检索查询文本的状态存储

RAG应该根据当前上下文来检索相关内容,作为查询文本的不仅仅只考虑最近的用户消息,有时还应该考虑最近或者全部对话历史,也可以在此基础进行一些过滤。TextSearchProvider将作为检索的查询文本封装在TextSearchProviderState中,并存在在当前Session状态中。如下面的代码片段所示,TextSearchProviderState是定义在TextSearchProvider中的一个内嵌类性,RecentMessagesText属性存储的就是作为检索的查询文本。TextSearchProvider利用一个ProviderSessionState<TextSearchProviderState>对象来extSearchProviderState进行基于Session状态的读写,它在Session状态字典中的Key可以通过TextSearchProviderOptions进行配置,默认为TextSearchProvider的类名。

public sealed class TextSearchProvider : MessageAIContextProvider
{
	public sealed class TextSearchProviderState
	{
		public List<string>? RecentMessagesText { get; set; }
	}

	private readonly ProviderSessionState<TextSearchProviderState> _sessionState;
	private IReadOnlyList<string>? _stateKeys;
    public override IReadOnlyList<string> StateKeys => this._stateKeys ??= [this._sessionState.StateKey];
    public TextSearchProvider(
        Func<string, CancellationToken, Task<IEnumerable<TextSearchResult>>> searchAsync,
        TextSearchProviderOptions? options = null,
        ILoggerFactory? loggerFactory = null)
    : base(options?.SearchInputMessageFilter, options?.StorageInputRequestMessageFilter, options?.StorageInputResponseMessageFilter)
    {
        _sessionState = new ProviderSessionState<TextSearchProviderState>(
            _ => new TextSearchProviderState(),
            options?.StateKey ?? this.GetType().Name,
            AgentJsonUtilities.DefaultOptions);
        ...
    }
}

3. TextSearchProvider配置选项

TextSearchProvider相关的配置选项定义在TextSearchProviderOptions类中,前面已经提到过它的StateKey属性(存储查询文本的Session状态键),接下来我们看看它的其他配置选项。TextSearchProviderOptions最重要的配置选项莫过于SearchTime了,它不仅仅是决定了RAG检索的时机,更是决定了整个输入增强的实现方式。具体来说,如果SearchTime设置为BeforeAIInvoke,那么TextSearchProvider会在每次LLM调用之前自动进行文本检索,并将检索结果作为上下文提供给LLM;如果SearchTime设置为OnDemandFunctionCalling,那么TextSearchProvider会提供一个供LLM调用的工具来按需触发文本检索,LLM可以根据当前的查询条件来决定是否需要调用这个工具来获取相关信息。

public sealed class TextSearchProviderOptions
{
	public enum TextSearchBehavior
	{
		BeforeAIInvoke,
		OnDemandFunctionCalling
	}

	public TextSearchBehavior SearchTime { get; set; } = TextSearchBehavior.BeforeAIInvoke;
	public string? FunctionToolName { get; set; }
	public string? FunctionToolDescription { get; set; }    
}

如果选择OnDemandFunctionCalling,那么我们需要通过FunctionToolName来指定这个工具的名称,通过FunctionToolDescription来描述这个工具的功能,以便LLM能够正确地调用它。默认的工具名称为Search,默认的工具描述为Allows searching for additional information to help answer the user question.

如果对话历史太长,将整个对话内容作为检索的查询不但没有必要,还可能会导致检索效率低下。除此之外,过多的字符串拼接操作和过长的查询文本也可能会对LLM的性能产生负面影响。为了解决这个问题,TextSearchProviderOptions提供了RecentMessageMemoryLimit这个配置选项,来限制在进行文本检索时,应该考虑最近多少条消息。默认值为0,意味着只考虑最近输入的用户消息,不考虑任何历史消息。RecentMessageRolesIncluded可以从角色维度进一步细化应该考虑哪些消息,默认只考虑User角色的消息,因为RAG是为了解决LLM的知识局限性问题,无需考虑它的回答。当我们将LLM的响应作为RAG检索条件时,可能导致搜索结果过度向已知信息倾斜。

public sealed class TextSearchProviderOptions
{
	public int RecentMessageMemoryLimit { get; set; }
    public List<ChatRole>? RecentMessageRolesIncluded { get; set; }

	public Func<IEnumerable<ChatMessage>, IEnumerable<ChatMessage>>? SearchInputMessageFilter { get; set; }
	public Func<IEnumerable<ChatMessage>, IEnumerable<ChatMessage>>? StorageInputRequestMessageFilter { get; set; }
	public Func<IEnumerable<ChatMessage>, IEnumerable<ChatMessage>>? StorageInputResponseMessageFilter { get; set; }
}

TextSearchProviderOptions的三个Filter会提供给基类MessageAIContextProvider,在调用ProvideMessagesAsync方法之前,SearchInputMessageFilter会对请求消息进行过滤。StorageInputRequestMessageFilterStorageInputResponseMessageFilter在调用StoreAIContextAsync方法之前会对待存储的请求和响应消息实施过滤。所以这三个Filter实际上是在对作为检索条件的消息进行过滤。

检索的结果作为上下文作为调用LLM提示词的一部分,我们可以利用TextSearchProviderOptionsContextFormatter属性提供的委托自行完成针对这段文本的格式化。如果没有提供ContextFormatter委托,TextSearchProvider将会按照默认的格式来将检索结果转换成文本,这个文本会包含针对上下文提示词前缀和要求回答中携带引用的提示词,对应着ContextPromptCitationsPrompt这两个属性。ContextFormatter的输入是一个TextSearchResult的列表,而TextSearchResult作为检索的结果,不仅包含基本的文本内容(Text属性),还包含通过SourceNameSourceLink属性提供的元信息,前者可以用来描述这个文本内容的来源,后者则可以提供一个链接让用户能够访问到这个来源。RawRepresentation属性则可以用来存储一些原始的、未经格式化的表示,这些表示可能来自于数据源的底层对象模型。

public sealed class TextSearchProviderOptions
{
	public string? ContextPrompt { get; set; }
	public string? CitationsPrompt { get; set; }
	public Func<IList<TextSearchProvider.TextSearchResult>, string>? ContextFormatter { get; set; }
}

public sealed class TextSearchProvider : MessageAIContextProvider
{
	public sealed class TextSearchResult
	{
		public string? SourceName { get; set; }
		public string? SourceLink { get; set; }
		public string Text { get; set; } = string.Empty;
		public object? RawRepresentation { get; set; }
	}
}

ContextPrompt和CitationsPrompt这两个属性的默认值分别为:

  • Consider the following information from source documents when responding to the user:
  • Include citations to the source document with document name and link if document name and link is available.

由于RAG检索的内容主要来源于私域系统,这些内容可能包含敏感信息,因此在日志和遥测中需要对这些信息进行脱敏处理。TextSearchProviderOptions提供了EnableSensitiveTelemetryDataRedactor这两个配置选项来支持我们对敏感信息进行保护。EnableSensitiveTelemetryData是一个开关,用来控制是否允许在遥测数据中包含敏感信息;Redactor则是一个Redactor对象,它提供了对敏感信息进行脱敏处理的方法,在日志和遥测中会调用这个对象的方法来对敏感信息进行脱敏。

public sealed class TextSearchProviderOptions
{
	
	public bool EnableSensitiveTelemetryData { get; set; }
	public Redactor? Redactor { get; set; }
}

public abstract class Redactor
{
	public unsafe string Redact(ReadOnlySpan<char> source);
	public abstract int Redact(ReadOnlySpan<char> source, Span<char> destination);
	public int Redact(string? source, Span<char> destination);
	public virtual string Redact(string? source);
	public unsafe string Redact<T>(T value, string? format = null, IFormatProvider? provider = null);
	public int Redact<T>(T value, Span<char> destination, string? format = null, IFormatProvider? provider = null);
	public bool TryRedact<T>(T value, Span<char> destination, out int charsWritten, ReadOnlySpan<char> format, IFormatProvider? provider = null);
	public abstract int GetRedactedLength(ReadOnlySpan<char> input);
	public int GetRedactedLength(string? input);
}

4. TextSearchProvider的实现原理

TextSearchProvider针对RAG的实现其实很简单。在重写的ProvideAIContextAsync方法中,如果配置选项SearchTimeOnDemandFunctionCalling,它会创建一个用于检索的工具注册到返回的AIConext中。如果SearchTimeBeforeAIInvoke,它会调用ProvideMessagesAsync方法返回的消息作为AIContextMessages属性。

public sealed class TextSearchProvider : MessageAIContextProvider
{    
    public TextSearchProvider(
        Func<string, CancellationToken, Task<IEnumerable<TextSearchResult>>> searchAsync,
        TextSearchProviderOptions? options = null,
        ILoggerFactory? loggerFactory = null);
    protected override async ValueTask<AIContext> ProvideAIContextAsync(
        AIContextProvider.InvokingContext context, 
        CancellationToken cancellationToken = default);
    protected override async ValueTask<IEnumerable<ChatMessage>> ProvideMessagesAsync(
        InvokingContext context, 
        CancellationToken cancellationToken = default);
    protected override ValueTask StoreAIContextAsync(
        InvokedContext context, 
        CancellationToken cancellationToken = default);
}

重写的ProvideMessagesAsync会按照如下的逻辑执行:

  • 从当前Session状态中提取TextSearchProviderState对象,并从中获取RecentMessagesText属性作为检索的查询文本列表,此列表会与当前请求的消息文本进行合并,生成最终的检索查询文本列表;
  • 这个列表最终被拼接(采用回车作为分隔符)成一个字符串,作为构造函数指定的searchAsync委托的输入参数来实施检索,并得到一个TextSearchResult的列表作为检索结果;
  • 如果配置选项ContextFormatter提供了委托,那么就调用这个委托来将TextSearchResult的列表转换成一个字符串;如果没有提供ContextFormatter委托,那么就采用默认的格式化方式来将TextSearchResult的列表转换成一个字符串,这个字符串会包含ContextPromptCitationsPrompt这两个提示词,以及检索结果的文本内容和来源信息;
  • 格式化后的字符串会被封装在一个User角色的ChatMessage中,并作为一个单元素的列表返回,供ProvideAIContextAsync方法将其作为AIContext的一部分返回;

在重写的StoreAIContextAsync方法中,如果当前Session存在并且配置选项RecentMessageMemoryLimit大于0,它会按照如下的方式在Session状态中更新查询文本列表:

  • 从当前Session状态中提取TextSearchProviderState对象,并从中获取RecentMessagesText属性作为当前的查询文本列表;
  • 根据配置选项RecentMessageRolesIncluded来过滤当前请求的消息和LLM的响应消息,得到一个新的消息列表,并将消息文本提取出来;
  • 原始的查询文本列表和新提取的消息文本列表进行合并,并根据配置选项RecentMessageMemoryLimit来限制对列表进行裁剪,得到一个新的查询文本列表;
  • 将新的查询文本列表更新到当前Session状态的TextSearchProviderState对象的RecentMessagesText属性中,以供下一次检索使用。

5. 查看生成的工具

我们不妨看看基于RAG检索结果生成的ChatMessage具体包含什么内容,以及如果将SearchTime配置为OnDemandFunctionCallingTextSearchProvider生成的工具又是什么样子的。为此,我们定义了如下这个AIContextTrackingProvider,它继承自AIContextProvider,并重写了InvokingCoreAsync方法,在这个方法中我们可以访问到当前调用的AIContext,从而查看其中包含的MessagesTools等信息。

class AIContextTrackingProvider: AIContextProvider
{
    protected override ValueTask<AIContext> InvokingCoreAsync(InvokingContext context, CancellationToken cancellationToken = default)
    {
        var index = 1;
        foreach(var message in context.AIContext?.Messages!)
        {
           Console.WriteLine($"""
               {new string('-', 20)} Message {index++} {new string('-', 20)}
               Role: {message.Role}
               Text:                
               {message.Text}
               """);
        }

        var function = context.AIContext?.Tools?.SingleOrDefault(tool => tool.Name == "Search") as AIFunction;
        if (function is not null)
        {
            Console.WriteLine($"""

                {new string('-', 20)} Tool {function.Name} {new string('-', 20)}
                Description: {function.Description}
                JsonSchema: {function.JsonSchema}
                """);
        }
        return base.InvokingCoreAsync(context, cancellationToken);
    }
}

我们将这个AIContextTrackingProviderTextSearchProvider一起添加到ChatClientAgentAIContextProviders中。由于我们希望查看的是由TextSearchProvider生成的工具或者消息,所以我们需要将AIContextTrackingProvider放在TextSearchProvider的后面。

using Azure.AI.Projects;
using dotenv.net;
using Microsoft.Agents.AI;
using Microsoft.Extensions.AI;
using OpenAI;
using OpenAI.Responses;
using System.ClientModel;
using static Microsoft.Agents.AI.TextSearchProvider;

DotEnv.Load();

var model = Environment.GetEnvironmentVariable("MODEL")!;
var apiKey = Environment.GetEnvironmentVariable("API_KEY")!;
var endpoint = Environment.GetEnvironmentVariable("OPENAI_URL")!;
var textSearchProvider = new TextSearchProvider(searchAsync: SearchAsync);
var trackingProvider = new AIContextTrackingProvider();
var agent = new OpenAIClient(
    credential: new ApiKeyCredential(key: apiKey),
    options: new OpenAIClientOptions { Endpoint = new Uri(endpoint) })
    .GetChatClient(model: model)
    .AsIChatClient()
    .AsAIAgent(options: new ChatClientAgentOptions { AIContextProviders = [textSearchProvider, trackingProvider] });

await agent.RunAsync(message: "2026年斯诺克世界赛冠军是谁?");

static Task<IEnumerable<TextSearchResult>> SearchAsync(string query, CancellationToken cancellationToken)
{
    if (query.Contains("2026") && query.Contains("斯诺克") && query.Contains("世界赛"))
    {
        var news = """
北京时间2026年5月5日,英国谢菲尔德克鲁斯堡剧院,决胜局最后一颗黑球落袋后,00后中国球员吴宜泽挥拳庆祝。18:17,吴宜泽击败肖恩·墨菲,拿下2026年斯诺克世锦赛冠军。
社交平台上,“吴宜泽夺冠”迅速登上热搜,不少球迷将这场胜利形容为“中国斯诺克新的接力时刻”。这是继2025年赵心童夺冠之后,中国选手再次问鼎这项赛事最高荣誉。这也是在经历2023年前后相关禁赛与争议事件后,中国球员重新回到世界顶级竞争序列的重要节点。
相比十多年前,丁俊晖在斯诺克领域的单点突破,中国近几年开始稳定涌现世界级斯诺克选手。从个体突破到群体崛起,这项运动在中国已经进入新的发展阶段。
""";
        var result = new TextSearchResult
        {
            RawRepresentation = news,
            SourceLink = "https://baijiahao.baidu.com/s?id=1864605028122769594",
            SourceName = "每日经济新闻",
            Text = news
        };
        return Task.FromResult<IEnumerable<TextSearchResult>>([result]);
    }
    else
    {
        return Task.FromResult<IEnumerable<TextSearchResult>>([]);
    }
}

输出(第二条就是基于RAG检索结果生成的消息):

-------------------- Message 1 --------------------
Role: user
Text:


2026年斯诺克世界赛冠军是谁?

-------------------- Message 2 --------------------
Role: user
Text:

## Additional Context

Consider the following information from source documents when responding to the user:
SourceDocName: 每日经济新闻
SourceDocLink: https://baijiahao.baidu.com/s?id=1864605028122769594
Contents: 北京时间2026年5月5日,英国谢菲尔德克鲁斯堡剧院,决胜局最后一颗黑球落袋后,00后中国球员吴宜泽挥拳庆祝。18:17,吴宜泽击败肖恩·墨菲,拿下2026年斯诺克世锦赛冠军。
社交平台上,“吴宜泽夺冠”迅速登上热搜,不少球迷将这场胜利形容为“中国斯诺克新的接力时刻”。这是继2025年赵心童夺冠之后,中国选手再次问鼎这项赛事最高荣誉。这也是在经历2023年前后相关禁赛与争议事件后,中国球员重新回到世界顶级竞争序列的重要节点。
相比十多年前,丁俊晖在斯诺克领域的单点突破,中国近几年开始稳定涌现世界级斯诺克选手。从个体突破到群体崛起,这项运动在中国已经进入新的发展阶段。
----

Include citations to the source document with document name and link if document name and link is available.

为了查看AIContextTrackingProvider生成的用于上下文检索的工具,我们需要提供AIContextTrackingProviderOptions来创建AIContextTrackingProvider,并将SearchTime配置为OnDemandFunctionCalling

DotEnv.Load();

var model = Environment.GetEnvironmentVariable("MODEL")!;
var apiKey = Environment.GetEnvironmentVariable("API_KEY")!;
var endpoint = Environment.GetEnvironmentVariable("OPENAI_URL")!;
var options = new TextSearchProviderOptions { 
    SearchTime = TextSearchProviderOptions.TextSearchBehavior.OnDemandFunctionCalling };
var textSearchProvider = new TextSearchProvider(searchAsync: SearchAsync, options: options);
var trackingProvider = new AIContextTrackingProvider();
var agent = new OpenAIClient(
    credential: new ApiKeyCredential(key: apiKey),
    options: new OpenAIClientOptions { Endpoint = new Uri(endpoint) })
    .GetChatClient(model: model)
    .AsIChatClient()
    .AsAIAgent(options: new ChatClientAgentOptions { AIContextProviders = [textSearchProvider, trackingProvider] });

await agent.RunAsync(message: "2026年斯诺克世界赛冠军是谁?");
...

输出:

-------------------- Message 1 --------------------
Role: user
Text:
2026年斯诺克世界赛冠军是谁?

-------------------- Tool Search --------------------
Description: Allows searching for additional information to help answer the user question.
JsonSchema: {"type":"object","properties":{"userQuestion":{"type":"string"}},"required":["userQuestion"]}