惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

酷 壳 – CoolShell
酷 壳 – CoolShell
H
Hacker News: Front Page
P
Palo Alto Networks Blog
T
ThreatConnect
Apple Machine Learning Research
Apple Machine Learning Research
博客园_首页
T
True Tiger Recordings
P
Privacy & Cybersecurity Law Blog
B
Blog
IT之家
IT之家
Last Week in AI
Last Week in AI
F
Full Disclosure
Hacker News: Ask HN
Hacker News: Ask HN
C
Comments on: Blog
Microsoft Azure Blog
Microsoft Azure Blog
C
Cybersecurity and Infrastructure Security Agency CISA
Microsoft Security Blog
Microsoft Security Blog
博客园 - 【当耐特】
N
News and Events Feed by Topic
NISL@THU
NISL@THU
腾讯CDC
雷峰网
雷峰网
Security Latest
Security Latest
李成银的技术随笔
M
Microsoft Research Blog - Microsoft Research
L
LangChain Blog
L
Lohrmann on Cybersecurity
cs.CL updates on arXiv.org
cs.CL updates on arXiv.org
C
Check Point Blog
Y
Y Combinator Blog
Recent Announcements
Recent Announcements
博客园 - Franky
N
News | PayPal Newsroom
V
V2EX
A
About on SuperTechFans
The Register - Security
The Register - Security
月光博客
月光博客
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
Google Online Security Blog
Google Online Security Blog
MyScale Blog
MyScale Blog
Cisco Talos Blog
Cisco Talos Blog
Vercel News
Vercel News
WordPress大学
WordPress大学
C
Cyber Attacks, Cyber Crime and Cyber Security
The Hacker News
The Hacker News
IntelliJ IDEA : IntelliJ IDEA – the Leading IDE for Professional Development in Java and Kotlin | The JetBrains Blog
IntelliJ IDEA : IntelliJ IDEA – the Leading IDE for Professional Development in Java and Kotlin | The JetBrains Blog
爱范儿
爱范儿
A
Arctic Wolf
L
LINUX DO - 最新话题
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More

博客园 - GDOUJKZZ

.net 8程序如何在信创的arm64架构下运行【nuget包如何判断能不能在arm架构跑呢】 【AI应用】【声纹识别】一、mini io 来构建高可用的文件存储方案 【AI】第五篇 大话说神经网络第一篇 docker 目录下的overlay2层的太多,导致占用大量占用磁盘空间怎么办呢。【docker目录清理】 【AI】第四篇 什么是神经网络 - GDOUJKZZ 【AI】前置篇 Ai Agent的全貌概览 【AI】第二篇 为什么会有神经网络 【AI】第一篇 语言模型的前世 n-gram的简单介绍 【一】AI赋能 javascript里面的var let const关键字区别和使用 学习心态 从应用开发转到大数据开发 一分钟RequireJS介绍 .NET 6 在小并发下如何生成唯一单据号 垃圾回收机制简单理解 NPOI导出大量数据的避免OOM解决方案【SXSSFWorkbook】 递归有环问题解决方案 C# 使用NPOI处理Excel模板-【前面部分固定,中间是动态的几行,尾部是固定的部分】 高并发的场景下,如何保证生产者投递到消息中间件的消息不丢失
【AI】第三篇 RAG是什么
GDOUJKZZ · 2025-12-11 · via 博客园 - GDOUJKZZ

RAG 不是单一技术,而是 “检索→增强→生成” 的闭环流程,每一步都有明确作用:

  1. 用户提问:比如 “2025 年污水厂氨氮排放标准最新要求是什么?”(环保场景典型问题)
  2. 问题预处理:LLM 先理解问题意图,转化为 “检索关键词 / 向量”(比如提取 “2025 污水厂 氨氮 排放标准”)【大模型的分析能力,提取重点】
  3. 检索阶段:检索器(Retriever)从知识库(环保法规文档、行业标准 PDF)中,通过 “向量匹配 / 关键词匹配” 找到最相关的内容片段(比如《城镇污水处理厂污染物排放标准(GB 18918-2024 修订版)》中氨氮限值条款)
  4. 增强阶段:将 “用户问题 + 检索到的相关片段” 一起喂给 LLM(相当于给 LLM “开卷考试”,提供参考资料)  【大模型对数据分析,归纳总结】
  5. 生成阶段:LLM 基于参考资料回答问题,同时标注信息来源(比如 “根据 GB 18918-2024 第 5.2 条,一级 A 标准氨氮限值为 1.5mg/L”)

你提到的 “检索器、知识库、LLM” 是三大核心,我们展开说明每个组件的作用和选型要点:

知识库 存储结构化 / 非结构化数据(文档、表格、API 数据) 优先用向量数据库(Milvus/Chroma)+ 传统数据库(MySQL),分别存储环保法规文档(非结构化)和监测数据(结构化) 检索器 精准找到与问题匹配的内容 混合检索(向量检索 + 关键词检索),比如用向量匹配找法规条款,用关键词匹配找监测数据编号 LLM 理解问题、整合检索内容、生成回答 通用场景用 Qwen/DeepSeek,专业场景用行业微调模型 嵌入(Embedding)+重排序 将文本转化为可计算的向量(检索的基础) 用 bge-large-zh,确保专业术语(如 “总氮”“TP”)的向量准确性
组件核心作用环保行业选型建议

  总结的 “知识增强” 和 “可信度增强” 是核心

  • 比如LLM 训练数据截止到 2024 年,无法知道 2025 年新修订的行业标准;
  • 通过 RAG 对接最新的相关公告和文档,AI 能准确回答 “2025 年 VOCs 排放新要求”,实现知识实时更新。
  • 某些行业对数据准确性要求极高(比如排污许可申报、环评报告撰写),RAG 让 AI 回答 “有据可查”;
  • 示例:AI 回答 “某污水厂总磷排放标准” 时,必须引用《GB 18918-2024》具体条款,而非凭空生成数值,避免合规风险。
  1. 误区 1:认为 “把文档扔进向量库就完事”—— 一些文档(如监测报告、法规)有大量表格 / 公式,需先做结构化处理(比如用 OCR 提取表格数据),否则检索不到关键信息;
  2. 误区 2:忽略 “检索精度”—— 行业术语多(如 “CODcr”“BOD5”),需优化嵌入模型的专业词汇适配,避免检索到无关内容;
  3. 误区 3:不做 “来源标注”—— 行业合规场景要求回答可追溯,必须让 AI 标注信息来源(文档名称、条款号),否则无法用于正式报告。

  RAG 的本质是 “让 AI 带着‘参考书’回答问题”—— 对大部分行业而言,这套架构既解决了 AI“不懂最新政策 / 企业数据” 的问题,又满足了合规场景下 “可追溯、无幻觉” 的要求,是目前大部分行业中 AI 应用中最成熟、最易落地的架构模式。