惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

T
Threatpost
罗磊的独立博客
月光博客
月光博客
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
博客园 - 【当耐特】
I
InfoQ
M
MIT News - Artificial intelligence
Last Week in AI
Last Week in AI
Hugging Face - Blog
Hugging Face - Blog
Martin Fowler
Martin Fowler
NISL@THU
NISL@THU
Vercel News
Vercel News
V
V2EX
P
Privacy International News Feed
Google DeepMind News
Google DeepMind News
S
Securelist
cs.CL updates on arXiv.org
cs.CL updates on arXiv.org
N
News and Events Feed by Topic
博客园_首页
G
GRAHAM CLULEY
Engineering at Meta
Engineering at Meta
www.infosecurity-magazine.com
www.infosecurity-magazine.com
S
Security Affairs
Security Latest
Security Latest
L
LINUX DO - 热门话题
S
Schneier on Security
The Last Watchdog
The Last Watchdog
博客园 - Franky
AI
AI
F
Full Disclosure
B
Blog
H
Heimdal Security Blog
H
Hacker News: Front Page
D
Docker
Stack Overflow Blog
Stack Overflow Blog
S
Secure Thoughts
Schneier on Security
Schneier on Security
Application and Cybersecurity Blog
Application and Cybersecurity Blog
Google Online Security Blog
Google Online Security Blog
aimingoo的专栏
aimingoo的专栏
有赞技术团队
有赞技术团队
Recent Announcements
Recent Announcements
The Cloudflare Blog
云风的 BLOG
云风的 BLOG
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
Apple Machine Learning Research
Apple Machine Learning Research
C
Cisco Blogs
W
WeLiveSecurity
L
LangChain Blog
P
Proofpoint News Feed

博客园 - AlfredZhao

生产环境里,为什么不建议把普通端口直接暴露到公网? ORACLE默默地搞了个免费的智能体工厂 GPT 省钱,不是别用最新模型,而是别浪费缓存 Docker 容器时区不对,`timedatectl` 不存在怎么办? AI 编程工作总结:从体验问题到模块能力建设 OCI 明明分配了 200G 系统盘,为什么 df 只看到 30G? vi 删除指定范围的行,不用再反复按 dd AI编程系列02:合并知识功能,给 AI 问数和 RAG 场景打基础 AI编程系列01:裸 API 账单场景下,如何自建 LLM 用量可视化看板 氛围编程实战系列:先规划清楚学习路径 入门:我的第一个Vibe Coding实践程序 Linux时区修改为CST 如何在Oracle Agent Factory中配置国内厂商的LLM? Oracle Deep Data Security (Deep Sec) 初体验 APEX实战第13篇:全套开发环境的本地配置与恢复实践 Codex 和 OpenClaw,到底差在哪? 微信对接OpenClaw的常见问题和解决方案 在群晖NAS上配置OpenClaw:一次踩坑后的保姆级教程(完整修订版) 用Docker安全驯服OpenClaw,并打通社交软件 RAG 时代的“破壁人”:为什么你的大模型应用急需 Docling? 为什么 AI 服务器首选 Ubuntu?难道 OEL 和 RHEL 不香吗? APEX实战第12篇:Oracle APEX 工作区密码忘记了怎么办? AI开发者如何无痛部署Oracle AI Database 26ai环境 Oracle 26ai 本地通用版这次是真的来了 Docker 快速入门:手把手教你打包 Python 应用 APEX实战第11篇:图形界面轻松解锁工作区账户 APEX实战第10篇:手把手教你给APEX打补丁 APEX实战第9篇:手把手教你集成RAS轻松实现真正的数据安全 小白学AI开发01:创建第一个示例Agent LangChain、LangFlow、LangGraph:一文讲清三大 LLM 框架的定位与差异 使用 Oracle 官方 HR Demo 快速验证 RAS 功能(小白实战指南) Oracle RAS:AI时代企业数据安全核心 新版MOS(My Oracle Support)主要变化 APEX实战第8篇:ORDS连库报错574?一招根治用户过期问题 为什么 Iceberg 在数据湖领域这么火
RAG技术从1.0到4.0,系统为何越来越“会想”
AlfredZhao · 2026-06-30 · via 博客园 - AlfredZhao

2026-06-30 00:30  AlfredZhao  阅读(2)  评论()    收藏  举报

很多人第一次接触RAG,往往只记住“检索增强生成”这几个字。但真正落地后就会发现,RAG并不是把知识库接到大模型上这么简单。笔者结合这份演进脉络,想用一篇短文讲清楚:RAG为什么会从1.0一路走到4.0,以及不同阶段到底适合什么场景。

01 | RAG 1.0到4.0,升级的核心逻辑是什么

第一代是 Naive RAG,结构很直接,就是“向量索引→近似检索→生成答案”三段式。它的问题也最典型:会出现检索偏差,比如“换新”误检到“回收”;拿回来的信息容易碎片化;甚至可能把相互矛盾的内容直接拼到答案里。这一代的准确率大约在60%。

第二代是 Advanced RAG,核心是把优化做到了检索前后两端。

① 检索前怎么优化

可以做查询改写,也可以先生成一个“假设答案”再反向去检索,还能通过更精细的索引方式提升召回质量。

② 检索后怎么优化

常见做法是加入重排序模型,并把向量检索和关键词检索结合起来,也就是混合检索。

这套双轨优化带来的结果很直接:准确率可以提升到80%,在电商客服场景里,80%的问题已经能够解决。

第三代是 Modular RAG。这一阶段的关键不是再补一个小功能,而是进入模块化设计。它会把路由、记忆、融合这些能力拆出来,形成更灵活的系统;检索方式也从“一次取回”变成“边检索边生成”的迭代式,或者根据问题复杂度按需扩展的自适应检索。带来的突破是:复杂问题解决率翻倍,准确率达到85%。

第四代是 Agentic RAG,也就是带有自主决策能力的智能体式RAG。它不只是检索信息,而是能完成“需求拆解→计划制定→工具调度→自我校验”的完整过程。比如面对“为孩子选学习机+使用指南”这样的复合需求,它已经不只是回答,而是在组织完成任务。不过代价也很清楚:多轮检索会带来更明显的响应延迟。

02 | Graph RAG为什么重要,但又不能乱上

在主线演进之外,Graph RAG 是一个很重要的分支方向。它的思路不是只做语义相似检索,而是先构建实体关系网络,再在图谱上做推理,比如从“商品→品牌→设计师”一路往下关联。

它特别适合处理多层关系查询,这是普通RAG不擅长的地方。但问题也很现实:构图成本很高,达到普通RAG的10到20倍,所以它往往不会单独使用,而是和向量检索协同配合。

03 | 企业落地时,应该怎么选型

真正做技术选型,不能只看“哪一代更先进”,而要看三个维度。

第一,看用户容忍度。Agentic RAG更聪明,但多轮检索意味着更长等待时间,智能程度和响应速度必须平衡。

第二,看问题复杂度。如果只是简单查询,Advanced RAG通常已经够用;只有遇到复杂、多跳的问题时,Modular RAG或Agentic RAG的价值才会真正体现出来。

第三,看成本预算。Graph RAG虽然强,但构建成本很高,投入要足够理性。

从落地建议来看,电商客服场景用Advanced RAG,已经能覆盖80%到90%的问题;金融风控更适合引入Graph RAG处理多层关系;如果是企业级复杂系统,可以考虑Agentic RAG,但前提是要提前做好性能优化。

关注我,和AI一起成长~