






















摘要:于多般推理之务,大语言模型(LLMs)常恃结构外知,如图谱与表格,此等知识多线性化为序列符码之表。然纵有足够能知,LLMs犹能生幻象之输出,而其下之机制,人犹未明。吾等究其机,乃知幻象起于系统内动,非偶然之噪。其一,注力偏重于捷径类之结构微候,而非遍及全境。其二,前馈表征未能固其所知,致模型复归参数之忆。复次,吾等之果示幻象恒与前馈层语义固之失相随,而注力之配则显任务相异之变。终,吾等示此机制之模,可越单跳图谱,及于多跳与表格之境,使于结构知识之式,得有效察幻象。
| 评述: | 载于 ACL 2026 论文集 |
| 主题: | 计算语言学 (cs.CL);人工智能 (cs.AI) |
| 报告 编号: | ACL 2026 |
| 引文格式: | arXiv:2605.26362 [cs.CL] |
| (或 arXiv:2605.26362v1 [cs.CL]为此版本之用) | |
| https://doi.org/10.48550/arXiv.2605.26362 arXiv所颁DOI,经DataCite(待注册) |
自:李尚浩 [视邮件]
[v1]
晴,廿五日丙午,戌时初刻,时差零点,载入七十六三箩,天机玄玄。
此內容由慣性聚合(RSS閱讀器)自動聚合整理,僅供閱讀參考。 原文來自 — 版權歸原作者所有。