惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

P
Proofpoint News Feed
WordPress大学
WordPress大学
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
爱范儿
爱范儿
Google DeepMind News
Google DeepMind News
Hugging Face - Blog
Hugging Face - Blog
V
Vulnerabilities – Threatpost
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
T
Tor Project blog
C
Cyber Attacks, Cyber Crime and Cyber Security
C
Cisco Blogs
Martin Fowler
Martin Fowler
O
OpenAI News
H
Hackread – Cybersecurity News, Data Breaches, AI and More
L
LangChain Blog
博客园 - 叶小钗
Help Net Security
Help Net Security
S
SegmentFault 最新的问题
Engineering at Meta
Engineering at Meta
雷峰网
雷峰网
Hacker News: Ask HN
Hacker News: Ask HN
博客园 - 司徒正美
博客园 - 聂微东
Scott Helme
Scott Helme
Security Latest
Security Latest
Recent Commits to openclaw:main
Recent Commits to openclaw:main
MyScale Blog
MyScale Blog
Microsoft Security Blog
Microsoft Security Blog
www.infosecurity-magazine.com
www.infosecurity-magazine.com
C
Cybersecurity and Infrastructure Security Agency CISA
人人都是产品经理
人人都是产品经理
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
P
Privacy International News Feed
U
Unit 42
TaoSecurity Blog
TaoSecurity Blog
Microsoft Azure Blog
Microsoft Azure Blog
H
Hacker News: Front Page
S
Secure Thoughts
The Cloudflare Blog
W
WeLiveSecurity
CTFtime.org: upcoming CTF events
CTFtime.org: upcoming CTF events
D
Docker
P
Palo Alto Networks Blog
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
SecWiki News
SecWiki News
H
Heimdal Security Blog
N
News and Events Feed by Topic
S
Security @ Cisco Blogs
K
KPMG report finds enterprise disconnect between AI and its ROI | CIO

博客园 - AlfredZhao

生产环境里,为什么不建议把普通端口直接暴露到公网? ORACLE默默地搞了个免费的智能体工厂 GPT 省钱,不是别用最新模型,而是别浪费缓存 Docker 容器时区不对,`timedatectl` 不存在怎么办? AI 编程工作总结:从体验问题到模块能力建设 OCI 明明分配了 200G 系统盘,为什么 df 只看到 30G? vi 删除指定范围的行,不用再反复按 dd AI编程系列02:合并知识功能,给 AI 问数和 RAG 场景打基础 AI编程系列01:裸 API 账单场景下,如何自建 LLM 用量可视化看板 氛围编程实战系列:先规划清楚学习路径 入门:我的第一个Vibe Coding实践程序 Linux时区修改为CST 如何在Oracle Agent Factory中配置国内厂商的LLM? Oracle Deep Data Security (Deep Sec) 初体验 APEX实战第13篇:全套开发环境的本地配置与恢复实践 Codex 和 OpenClaw,到底差在哪? 微信对接OpenClaw的常见问题和解决方案 在群晖NAS上配置OpenClaw:一次踩坑后的保姆级教程(完整修订版) 用Docker安全驯服OpenClaw,并打通社交软件 RAG 时代的“破壁人”:为什么你的大模型应用急需 Docling? 为什么 AI 服务器首选 Ubuntu?难道 OEL 和 RHEL 不香吗? APEX实战第12篇:Oracle APEX 工作区密码忘记了怎么办? AI开发者如何无痛部署Oracle AI Database 26ai环境 Oracle 26ai 本地通用版这次是真的来了 Docker 快速入门:手把手教你打包 Python 应用 APEX实战第11篇:图形界面轻松解锁工作区账户 APEX实战第10篇:手把手教你给APEX打补丁 APEX实战第9篇:手把手教你集成RAS轻松实现真正的数据安全 小白学AI开发01:创建第一个示例Agent LangChain、LangFlow、LangGraph:一文讲清三大 LLM 框架的定位与差异 使用 Oracle 官方 HR Demo 快速验证 RAS 功能(小白实战指南) Oracle RAS:AI时代企业数据安全核心 新版MOS(My Oracle Support)主要变化 APEX实战第8篇:ORDS连库报错574?一招根治用户过期问题 为什么 Iceberg 在数据湖领域这么火
RAG技术从1.0到4.0,系统为何越来越“会想”
AlfredZhao · 2026-06-30 · via 博客园 - AlfredZhao

2026-06-30 00:30  AlfredZhao  阅读(2)  评论()    收藏  举报

很多人第一次接触RAG,往往只记住“检索增强生成”这几个字。但真正落地后就会发现,RAG并不是把知识库接到大模型上这么简单。笔者结合这份演进脉络,想用一篇短文讲清楚:RAG为什么会从1.0一路走到4.0,以及不同阶段到底适合什么场景。

01 | RAG 1.0到4.0,升级的核心逻辑是什么

第一代是 Naive RAG,结构很直接,就是“向量索引→近似检索→生成答案”三段式。它的问题也最典型:会出现检索偏差,比如“换新”误检到“回收”;拿回来的信息容易碎片化;甚至可能把相互矛盾的内容直接拼到答案里。这一代的准确率大约在60%。

第二代是 Advanced RAG,核心是把优化做到了检索前后两端。

① 检索前怎么优化

可以做查询改写,也可以先生成一个“假设答案”再反向去检索,还能通过更精细的索引方式提升召回质量。

② 检索后怎么优化

常见做法是加入重排序模型,并把向量检索和关键词检索结合起来,也就是混合检索。

这套双轨优化带来的结果很直接:准确率可以提升到80%,在电商客服场景里,80%的问题已经能够解决。

第三代是 Modular RAG。这一阶段的关键不是再补一个小功能,而是进入模块化设计。它会把路由、记忆、融合这些能力拆出来,形成更灵活的系统;检索方式也从“一次取回”变成“边检索边生成”的迭代式,或者根据问题复杂度按需扩展的自适应检索。带来的突破是:复杂问题解决率翻倍,准确率达到85%。

第四代是 Agentic RAG,也就是带有自主决策能力的智能体式RAG。它不只是检索信息,而是能完成“需求拆解→计划制定→工具调度→自我校验”的完整过程。比如面对“为孩子选学习机+使用指南”这样的复合需求,它已经不只是回答,而是在组织完成任务。不过代价也很清楚:多轮检索会带来更明显的响应延迟。

02 | Graph RAG为什么重要,但又不能乱上

在主线演进之外,Graph RAG 是一个很重要的分支方向。它的思路不是只做语义相似检索,而是先构建实体关系网络,再在图谱上做推理,比如从“商品→品牌→设计师”一路往下关联。

它特别适合处理多层关系查询,这是普通RAG不擅长的地方。但问题也很现实:构图成本很高,达到普通RAG的10到20倍,所以它往往不会单独使用,而是和向量检索协同配合。

03 | 企业落地时,应该怎么选型

真正做技术选型,不能只看“哪一代更先进”,而要看三个维度。

第一,看用户容忍度。Agentic RAG更聪明,但多轮检索意味着更长等待时间,智能程度和响应速度必须平衡。

第二,看问题复杂度。如果只是简单查询,Advanced RAG通常已经够用;只有遇到复杂、多跳的问题时,Modular RAG或Agentic RAG的价值才会真正体现出来。

第三,看成本预算。Graph RAG虽然强,但构建成本很高,投入要足够理性。

从落地建议来看,电商客服场景用Advanced RAG,已经能覆盖80%到90%的问题;金融风控更适合引入Graph RAG处理多层关系;如果是企业级复杂系统,可以考虑Agentic RAG,但前提是要提前做好性能优化。

关注我,和AI一起成长~