























2026-06-30 00:30 AlfredZhao 阅读(2) 评论() 收藏 举报
很多人第一次接触RAG,往往只记住“检索增强生成”这几个字。但真正落地后就会发现,RAG并不是把知识库接到大模型上这么简单。笔者结合这份演进脉络,想用一篇短文讲清楚:RAG为什么会从1.0一路走到4.0,以及不同阶段到底适合什么场景。
第一代是 Naive RAG,结构很直接,就是“向量索引→近似检索→生成答案”三段式。它的问题也最典型:会出现检索偏差,比如“换新”误检到“回收”;拿回来的信息容易碎片化;甚至可能把相互矛盾的内容直接拼到答案里。这一代的准确率大约在60%。
第二代是 Advanced RAG,核心是把优化做到了检索前后两端。
可以做查询改写,也可以先生成一个“假设答案”再反向去检索,还能通过更精细的索引方式提升召回质量。
常见做法是加入重排序模型,并把向量检索和关键词检索结合起来,也就是混合检索。
这套双轨优化带来的结果很直接:准确率可以提升到80%,在电商客服场景里,80%的问题已经能够解决。
第三代是 Modular RAG。这一阶段的关键不是再补一个小功能,而是进入模块化设计。它会把路由、记忆、融合这些能力拆出来,形成更灵活的系统;检索方式也从“一次取回”变成“边检索边生成”的迭代式,或者根据问题复杂度按需扩展的自适应检索。带来的突破是:复杂问题解决率翻倍,准确率达到85%。
第四代是 Agentic RAG,也就是带有自主决策能力的智能体式RAG。它不只是检索信息,而是能完成“需求拆解→计划制定→工具调度→自我校验”的完整过程。比如面对“为孩子选学习机+使用指南”这样的复合需求,它已经不只是回答,而是在组织完成任务。不过代价也很清楚:多轮检索会带来更明显的响应延迟。
在主线演进之外,Graph RAG 是一个很重要的分支方向。它的思路不是只做语义相似检索,而是先构建实体关系网络,再在图谱上做推理,比如从“商品→品牌→设计师”一路往下关联。
它特别适合处理多层关系查询,这是普通RAG不擅长的地方。但问题也很现实:构图成本很高,达到普通RAG的10到20倍,所以它往往不会单独使用,而是和向量检索协同配合。
真正做技术选型,不能只看“哪一代更先进”,而要看三个维度。
第一,看用户容忍度。Agentic RAG更聪明,但多轮检索意味着更长等待时间,智能程度和响应速度必须平衡。
第二,看问题复杂度。如果只是简单查询,Advanced RAG通常已经够用;只有遇到复杂、多跳的问题时,Modular RAG或Agentic RAG的价值才会真正体现出来。
第三,看成本预算。Graph RAG虽然强,但构建成本很高,投入要足够理性。
从落地建议来看,电商客服场景用Advanced RAG,已经能覆盖80%到90%的问题;金融风控更适合引入Graph RAG处理多层关系;如果是企业级复杂系统,可以考虑Agentic RAG,但前提是要提前做好性能优化。
关注我,和AI一起成长~
此内容由惯性聚合(RSS阅读器)自动聚合整理,仅供阅读参考。 原文来自 — 版权归原作者所有。