惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

Google DeepMind News
Google DeepMind News
F
Fortinet All Blogs
阮一峰的网络日志
阮一峰的网络日志
Apple Machine Learning Research
Apple Machine Learning Research
爱范儿
爱范儿
WordPress大学
WordPress大学
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
J
Java Code Geeks
罗磊的独立博客
S
SegmentFault 最新的问题
V
V2EX
V
Visual Studio Blog
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
美团技术团队
博客园 - 三生石上(FineUI控件)
Stack Overflow Blog
Stack Overflow Blog
Y
Y Combinator Blog
MyScale Blog
MyScale Blog
D
Docker
Google DeepMind News
Google DeepMind News
Blog — PlanetScale
Blog — PlanetScale
M
Microsoft Research Blog - Microsoft Research
Martin Fowler
Martin Fowler
S
Secure Thoughts
B
Blog
cs.CL updates on arXiv.org
cs.CL updates on arXiv.org
www.infosecurity-magazine.com
www.infosecurity-magazine.com
Recent Announcements
Recent Announcements
MongoDB | Blog
MongoDB | Blog
C
Cisco Blogs
C
CERT Recently Published Vulnerability Notes
T
True Tiger Recordings
GbyAI
GbyAI
P
Proofpoint News Feed
P
Privacy International News Feed
Jina AI
Jina AI
The Cloudflare Blog
I
Intezer
AWS News Blog
AWS News Blog
Hacker News - Newest:
Hacker News - Newest: "LLM"
S
Security Archives - TechRepublic
NISL@THU
NISL@THU
The Register - Security
The Register - Security
Recent Commits to openclaw:main
Recent Commits to openclaw:main
P
Palo Alto Networks Blog
S
Schneier on Security
L
LINUX DO - 热门话题
C
CXSECURITY Database RSS Feed - CXSecurity.com
Security Latest
Security Latest
C
Cybersecurity and Infrastructure Security Agency CISA

V2EX

[Surge] 6 折转 Surge 车位 用 mac 连接 Windows RDP,没有 udp, windows 却有 [分享发现] vanyosapce.com 跑路了? [自然语言处理] Humanize-Text 4 步把 AI 文本变成人类写作: DeepSeek×2 + Google + Niutrans [☕Vibe Coding🤖] 大家觉得 OpenCode 和 Claude Code 哪个更好用呢 技术岗的领导完全不懂技术,真想跑路 [推广] ai 账号店铺 专营 gpt Claude gemini 成品号 卡密直冲 [西安] 有没有携程常订五星级酒店的大佬,有兴趣可以来免费体验一下小店 [分享创造] 非科班零基础, vibe 了一个基于 telegram 公开群组生成新闻网站的项目 有没有听说过这种买断政策的公司? 前几天看到 V 站老哥的「新闻雷达」,照着试着学做了个微信小程序版 为什么字节 出了 trae 又搞了个 trae cn, 阿里搞了个 qoder 又出了个 qoder cn? 一个软件搞不定吗? [问与答] Mac 和小米手机之间的互联效果咋样? 禁止境外炒股了,兄弟们怎么看 [推广] Codex 新站点 HappyCode 推广,纯 Plus 号池(0.04 倍率)活动送 75 刀额度 [TV|免费] 全功能投屏工具 - AirPlay/电脑/有线镜像/4K/H.265/30ms 极低延迟 每天上班打王者刷视频,手指都受不了了,求推荐兼职,我会开发 作为 Linux 发行版, CachyOS 性能和包丰富度表现堪称完美。 大家用 claude code 是订阅还是买 apikey 来使用啊 [投资] 20260522 大环境不好存量全死了只建议开免费的美国嘉信和盈透了 [生活] 今天我生日,可以薅 V 友一句生日快乐吗? 如果用 AI 写一个小网游,每周玩法的胜利者会直接获得跟 ai 交流的机会,就跟龙珠一样,如此循环往复,有搞头么 老虎证券的“环球账户”,即古代老虎证券和 ibkr 合作的那个,咋说? 老虎、富途被罚,除了盈透等几家美国券商,身在大陆还有其它投资美股的渠道吗 买美股的路要被彻底堵死了,富途老虎长桥被重罚,大陆存量客户只准卖不准买,怎么办 claude -p 现在到底走什么额度啊 [分享创造] 兄弟们 vibe 了一个很好用的 vim 翻译插件, 分享给大家 证监会拟决定:没收老虎、富途、长桥境内外相关主体全部违法所得,并依法严厉处罚 [分享发现] ESP32-S31 测评 老虎、富途、长桥将被罚 2 年集中整治如何影响跨境炒股投资者 [OpenAI] ChatGPT Pro 额度怎么蹬满? 我发现有了 AI 之后,很多人都在重复造轮子 读"Cursor 的 Debug 模式误删 E 盘???GB 文件"有感 哦豁,猪要养肥了杀,对老虎、富途、长桥动手了 如果问各大 AI,谁被网友们称作畜生 AI 公司公司…… [求职] 西安| AI Agent / 数字员工 / 企业 AI 工作流架构与交付方向,寻找长期发展机会 你们的 Claude Code 好了吗 从公开发言和实际行动来看, Anthropic 这家公司一直以来秉持的是不是一种 AI 门罗主义? CodeX 会员也需要验证手机号码了? [DDShub] 折扣海外模型站 Markdown 表格语法更新了? AI 时代 产品需求文档(PRD) 软件需求文档(SRS) 应该怎么写呢?有推荐的模板吗?有推荐的 SKILL 吗? 区块链开发工程师 [手写分享] 开源的项目 star 破 300 了,编程没有你想得那么重要 太难了, 视频面试完后没有任何的回应 V2EX 老虎,富途,长桥统统阵亡,罚没所得,只能卖出/提现 时脉 API 使用 最近在学习 Web3,整理了一些易懂的资料,感兴趣的可以看看 也不知道会不会被开盒,还是憋不住想说说。以后借钱一定要当时就签个腾讯签的借条啊。前几个月借给朋友 5 万,说过两个月还,到现在一直了无音讯。我准备下周问问,不论如何补个欠条。这一两周晚上老是想到这事,太内耗了。 八部门发文整治非法跨境证券期货基金经营,只允许存量投资者单向卖出并转出资金,证监会已对老虎、富途、长桥非法跨境展业立案调查 最激进的 FOF,回撤反而最小? [开源] 开发了一个支持 Claude、Codex 的通知工具,挺实用 如何看待打击 境外机构 在境内提供开户和交易服务? [程序员] AI 蓬勃发展,各种资讯满天飞,大家都是从哪里获取 AI 资讯 有湖南的 V 友吗?听说枪战了? [Google] [求助] 银联卡/国内 master 订阅的 Google AI pro 方案使用 gemini cli [炸裂福利] 吹爆这款海外住宅代理!新用户注册免费送流量,文末再送 5 个独享 CDK,手慢无! [问与答] 备用 android 机求推荐 坐标杭州,不签同意分月发 n+1 的协议,直接就不给 n+1 了?该怎么维权 [Linux] 《铜豌豆 Linux 》12.14.1 版本发布 黄金这波真的起不来了吗 OpenAI 封号后续来了 万物皆可盘,帮我推荐点可以盘玩的物件 线上业务迁移服务器,求大佬分析一下风险 准备下半年去一次香港,有没有什么时间推荐 关于电车还是油车的抉择 阿里云国际站账户实名认证总是失败? LingduCloud 带你直接跳过风控坑! [NAS] 家宽这么不稳定,有没有 NAS 托管服务么? [推广] 世界杯准备来了,有没有球迷呢,手搓了一个 AI 预测网站 [分享发现] ToDesk 的吃相瞬间让人作呕 [远程工作] SmartDeer 招聘 AI Coding 全栈工程师|远程协作| 12k-20k / 月 有啥东西是俄罗斯有,国内没有的? 我创建的这个节点你们会用吗? 求问如何使用 imgur 图床 明天软考,大佬们准备好了吗 wawo(智能驾驶) ¥79 元 /年 2G 内存 2T 流量 2000Mbps [开源软件] [开源] 终于实现一边用中转站一边在手机上用 codex 了 最近把之前做的图片搜索,用来拿着搜鞋了 vibe 了一个月,做了一个网页对网页的公网局域网传输 Claude Desktop 接 ccswitch 后,怎么使用 mcp 呢 [分享创造] 平时自己看股票收益的时候需要跨平台 自己搓了个简单的看收益的 [求助] 安卓手机的 chatgpt 打开 codex 报错 request is not allowed [分享创造] 探讨:如何用 Subagent 机制解决 AI 自动编程时的 Context 溢出与膨胀问题? [问与答] openlist、alist 还是其他? [问与答] chatgpt plus 不支持 codex-cli 吗? [人工智能] AI 真是太恶心了,本来指望他攻克癌症、可控核聚变等真正造福人类的事情,结果弄个大语言模型淘汰人类脑力工作 完全使用 AI Coding 上线一个工具站,帮看看是不是 bug 满天飞 安装新版 antigravity ide 居然不支持从上个老版本导入设置 Agent 任务编排工具求问 除了闲鱼,有什么途径搞定台湾手机号么? [全球工单系统] 阿里云没有能够处理问题的工程师了吗? [Apple] Surge 作者将 𝕏 个人简介修改为已退休 也是 vibe coding 上了,第一款 app 在审核了 现在还有认真做 Code Review 和重视代码质量的公司吗? 年前被裁员,过完年到现在也没找到工作。 蔚来换电讨论 OmniSide:聚合 GPT-5 / Claude 4.5 / Gemini 3 Pro 的 AI 工具,国内可直连 chatgpt 手机 app 使用 codex 无法读取到 codex cli 的最近会话也无法选择项目目录,有解么? ai 的出现,导致现在社区里全是 ai 话题,好无趣~
我觉得 AI 幻觉可能是避免不了的了,这也许就是人类工程师还存在的理由?
cxd8190102 · 2026-05-22 · via V2EX

现在都说要跟 AI 打好配合,提升工作效率。但是我用了这么久下来,发现 AI 幻觉是避免不了的,只是或多或少的问题。

比方说你要搭一套 RAG 系统,或者给 Agent 接上公司内部知识库,测试的时候看起来还行,但一遇到真实的文档,比方说一份产品规格书,一份带多级嵌套表格的金融年报,或者是一组混排了图片、表格、参考文献的技术白皮书......AI 就开始频繁出错。要不就说信息找不到,要不就找错。

但是呢,它这些“幻觉”不是每次都出现的,它是时对时错,毫无规律,你调整 Prompt 、更换 Embedding 模型、试了各种分块策略,但效果总是不稳定。整到后面,人都麻了。

有时候我会想,算了,也许这就是人类程序员还存在的理由?————给 AI 擦屁股?

分享一下我给 AI 擦了这么久的屁股之后,感觉比较有用的一些思路吧。

首先模型是没法大改的了,至少对于我等普通小喽啰而言,等它自己更新更现实(大佬应该不会看到我的帖子吧,请 pass 哈)。但是在这个过程中,活还是要干的,那么怎么保证产出的准确性呢?我觉得优化 RAG 是一个比较可行的思路。

现在的大模型在生成答案前,往往会先通过 RAG 从广泛的文档数据库中检索相关信息,然后利用这些信息来引导生成过程。但大多数 RAG 系统处理文档的方式非常“暴力”:它会把 PDF 、Word 或者网页内容提取成纯文本,然后用一个固定的窗口大小(比如 500 个 token )把文本切成一块块,也就是所谓的 Chunk 。

在这个过程中,标题层级可能被削平了,表格被拦腰截断,图和文字的关联彻底消失。每个 Chunk 都是一张碎片,前后文、结构、归属关系全丢失,丢给 AI 做检索增强时很容易让 AI 找不着北。

但 AI 是被训练过的,它要避免说“我不知道”,这是“主人的命令”。于是,它只好用语言模型的概率能力去“脑补”,幻觉就这样产生了。

我的解决办法,就是换一种解析方式。抛弃传统的按字数打断的切片方式,转而采用类似脑图的树形结构进行拆分,尽量保留切片的上下文信息,减少信息缺失导致的 AI“脑补”行为。

具体流程分三步:

1 、解析。接入高质量的解析器来读取 PDF 、PPT 、图片、表格等格式,先拿到一个相对干净的文本初稿。

2 、结构化。建立文档的标题树,从一级标题到二级、三级,每一块文本都挂载到对应的章节路径上。表格和图片不是抽离出来当作独立附件,而是和内联的上下文文本牢牢绑定,确保 AI 能看到“这张表格是属于哪一段话”的完整关系。

3 、构建记忆。构建一个包含章节树、文本块、摘要、图像描述以及跨文档链接的轻量级记忆图谱。这个图谱就像是给 AI 配了一本带有详细目录、索引和超链接的电子书,AI 检索时可以在图谱里沿着路径上下左右导航,精准定位到最相关的证据区域,而不是仅仅依靠向量相似度去猜测。

测试下来,相比于传统的 RAG 或是使用原始文本,AI 的表现都要好很多:以 RAG 中常见的 Agent 问答任务为测试场景,当直接给 Agent 提供原始文档,或者使用主流解析器生成的 markdown/json 文件时,Agent 的最终回答准确率大约在 53%左右。

但使用新方法处理过的文档后,AI 准确率提升到了 79%。同时,Agent 的首次搜索准确率相对原始文档提升了 36%,召回率提升了 10%。再者,因为切片太碎导致的无效检索减少了嘛,所以 Token 消耗和搜索时间也随之下降了。

https://imgur.com/a/xlautnf

这在跟 AI agent 有关的场景里面都适用。

现在,我把这个方法打包成了一个工具 Knowhere ,开源的: https://github.com/Ontos-AI/knowhere 。如果你懒得自己操作,那可以借助工具的力量。

它可以显著提升这几类场景的体验:

  • 面向企业的智能问答或知识库。Knowhere 能让 AI 给出的答案更准确、更可追溯,每一条结论都能定位回原文的具体位置。

  • 金融、法律、医疗等垂直领域的 Agent 应用。Knowhere 可以保留多级复杂表格和图表的结构,不再让关键数据被“切碎”。

  • 如果你在管理大量学术文献或技术文档,它可以在不同文档之间建立关联图谱,让 Agent 做跨文档推理时更可靠。

欢迎尝试,有问题随时问我。