






















摘要:检索增强生成(RAG)日益支撑高风险应用,然犹存Confundo式污染之患,敌对优化之文书可操纵生成之输出。既有之防御,皆假说检测中毒之证可防其害。吾示此假说非是:模型显监测控制之隙——其能察检索证据之矛盾,犹可应中毒之陈。吾引Cordon之理——无最终合成之能者,不得涉不信赖之自然语言证据——并藉CORDON-MAS实现之,此乃分区之框架,以架构分离证据提取、跨源审计、答案合成诸务,使诸能者具不对称记忆之权。于五BEIR数据集,CORDON-MAS较未防御之RAG,减攻击成功率九十二点四成。此更RAG中毒之患,自检测之题,为信息流控制之题。
| 科目: | 密码学与安全(cs.CR);人工智能(cs.AI) |
| 引用格式: | arXiv:2605.26754 [cs.CR] |
| (或 arXiv:2605.26754v1 [cs.CR]为此版本) | |
| https://doi.org/10.48550/arXiv.2605.26754 由DataCite发布的arXiv DOI(注册待定) |
来自:孟寒 [查看邮箱]
[v1]
周二,西元二零二六年五月廿六日,格林威治标准时间九时二十七分十九秒(1,102 KB)
此內容由慣性聚合(RSS閱讀器)自動聚合整理,僅供閱讀參考。 原文來自 — 版權歸原作者所有。