惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

V
Vulnerabilities – Threatpost
B
Blog RSS Feed
D
Docker
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
有赞技术团队
有赞技术团队
aimingoo的专栏
aimingoo的专栏
大猫的无限游戏
大猫的无限游戏
阮一峰的网络日志
阮一峰的网络日志
The Register - Security
The Register - Security
S
SegmentFault 最新的问题
Microsoft Azure Blog
Microsoft Azure Blog
月光博客
月光博客
博客园 - 叶小钗
I
InfoQ
K
KPMG report finds enterprise disconnect between AI and its ROI | CIO
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
T
Threat Research - Cisco Blogs
S
Schneier on Security
L
LINUX DO - 热门话题
G
GRAHAM CLULEY
Y
Y Combinator Blog
Know Your Adversary
Know Your Adversary
P
Palo Alto Networks Blog
Security Latest
Security Latest
Stack Overflow Blog
Stack Overflow Blog
P
Privacy International News Feed
V
Visual Studio Blog
L
Lohrmann on Cybersecurity
Martin Fowler
Martin Fowler
I
Intezer
F
Full Disclosure
Apple Machine Learning Research
Apple Machine Learning Research
MongoDB | Blog
MongoDB | Blog
S
Security Archives - TechRepublic
S
Security Affairs
The GitHub Blog
The GitHub Blog
博客园 - 【当耐特】
Application and Cybersecurity Blog
Application and Cybersecurity Blog
H
Hackread – Cybersecurity News, Data Breaches, AI and More
T
Troy Hunt's Blog
Cyber Security Advisories - MS-ISAC
Cyber Security Advisories - MS-ISAC
Google DeepMind News
Google DeepMind News
Engineering at Meta
Engineering at Meta
博客园 - 司徒正美
云风的 BLOG
云风的 BLOG
Forbes - Security
Forbes - Security
S
Security @ Cisco Blogs
Google Online Security Blog
Google Online Security Blog
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
L
LINUX DO - 最新话题

雷峰网

1.8亿人在小红书读书:图书业在小红书电商营收规模年增超30% | 雷峰网 减重300kg,首搭5nm智驾芯片:2026款乐道L90正式亮相 | 雷峰网 阶跃和千⾥科技官宣战略合作:打造原⽣智驾基座模型,提升物理AI能⼒上限 | 雷峰网 “还债骑手”被强制下线240次:“开始我很反感过劳提醒,影响赚钱” | 雷峰网 石头科技:2025年营收高增56.51%,2026Q1营收增23.31% | 雷峰网 Mythos引爆攻击工业化时代,奇安信:构建三位一体内生安全体系是破解之道 | 雷峰网 曝两家科技大厂争投DeepSeek,估值飙至200亿美元;小米深夜放大招!最强大模型MiMo-V2.5系列发布;微软 Xbox 部门将裁员15% | 雷峰网 RGB-Mini LED电视普及风暴,海信正式发布小墨E5S Pro | 雷峰网 标配8255芯片与CDC,奇瑞试图终结“燃油车无智驾”时代 | 雷峰网 德赛西威也不相信,智驾能让Tier1躺着赚钱 | 雷峰网 找来刘翔做代言人,可能是智己LS8最好的一步棋 | 雷峰网 「中国版Grok上车」分水岭:阶跃交出首份量产答卷 | 雷峰网 百度Create大会双主论坛议程揭晓,多项重磅升级发布将集中亮相 | 雷峰网 泄露用户隐私!曝某AI助手将B用户简历发给A用户;苹果更换CEO原因曝光;微信宣布5国可用微信支付;航旅纵横「崩」了一天,借钱功能却正常 | 雷峰网 一季度交付1200件精益工具,希音深入技术创新提升按需时尚竞争力 | 雷峰网 从“替代”到“重构”:联想开天“1+2+N”如何重写信创AI PC逻辑? | 雷峰网 中山大学郭裕兰团队:数据充足却训练失败,多智能体到底卡在哪丨CVPR 2026 | 雷峰网 上交大 x vivo 团队:一个简单改动,让 diffusion 全面提升丨CVPR 2026 死亡率「99%」的芯片创业淘汰赛,为旌科技为何能活下来? | 雷峰网 清华段岳圻团队论文:从调参数到做控制,文生图迎来一次方法论升级丨CVPR 2026 | 雷峰网 东南大学耿新团队:模型不是不会做,而是被「挤掉了能力」丨CVPR 2026 | 雷峰网 西湖大学张驰团队:不重训,也能让视频生成更长更稳丨CVPR 2026 | 雷峰网 西湖大学张驰团队:从视觉合成到空间理解,视频 AI 正在「转向」丨CVPR 2026 | 雷峰网 21.0975 公里,是人形机器人的里程碑,也是 RISC-V 的新起点 | 雷峰网 独家 | 华为19级天才少年赵立晨离职创业,瞄准具身 Agentic OS 独家 | CMU系⼜诞⽣⼀家具⾝智能公司「Zeno AI」 | 雷峰网 Token消耗量翻10倍才算企业转型及格线?三位产业一线大佬教你用出性价比 | 雷峰网 阿里发布Qwen3.6-Max预览版,登顶最佳国产模型 | 雷峰网 郭达雅加入巨头背后:顶尖AI人才为何向大厂「回流」? | 雷峰网 解决机器人散热困境,华科冷芯高速悬浮泵液冷方案助力荣耀人形机器人“闪电”夺冠 | 雷峰网 智元邓泰华宣布:具身智能行业进入「部署态」 | 雷峰网 独家丨前安克研发总监丁准离职创业,获头部美元基金押注 | 雷峰网 曝DeepSeek V4将于本周发布,梁文锋对外融资20亿;雷军在服务区被堵车里维权?小米徐洁云回应;宇树H1半马被担架抬离赛道丨雷峰早报 | 雷峰网 广州一斗虾赛现场各路选手比拼蒸馏,现场诞生近50个“技能包” | 雷峰网 智元 ×Hitch Open|深耕具身智能,共建全球物理智能学术生态 | 雷峰网 2026广汽科技日重磅发布五大核心技术,以“科技向心”引领智能出行时代 | 雷峰网 一汽大众与卓驭科技的七年协同,交出一份燃油车智能化的成绩单 | 雷峰网 腾讯的长青游戏,今天又进化了一次 | 雷峰网 智己LS8上市:24.98万起售,刘翔站台的这台「最强8系」能打吗? | 雷峰网 全球1100万台出货,追觅打造最聪明的扫地机 | 雷峰网 阶跃率先跑通“中国版 Grok 上车”量产交付!超级 Eva 搭载极氪8X 今起上市 物理AI时代,为什么需要一颗“舱驾融合”芯片? | 雷峰网 逸安启欢迎问界加入,与宝马、梅赛德斯-奔驰携手, 共同推进中国豪华超充网络的发展 | 雷峰网 逐际动力开源 FluxVLA Engine:专为具身智能打造的标准化VLA工程底座 | 雷峰网 独家丨AWS大中华区多位L8高管迎来变动,SA部门负责人代闻离职 | 雷峰网 头部品牌 “加码”东南亚 泡泡玛特新品在Lazada发售 | 雷峰网 D19起售价21.98万元,零跑能成为9系SUV的“破局者”吗? | 雷峰网 全球首款!进迭时空 RISC-V AI CPU K3 成功适配 OpenHarmony 6.1 4小时闭门会,15位运动科技创业者聊透了哪些「不能公开说」的真相 | 雷峰网 在女性黑客松上,看见AI硬件的另一种可能 | 雷峰网 Plaud 爆火后,YoooClaw 要改写 AI 硬件的剧本 黄仁勋:DeepSeek在华为芯片上发布「很可怕」;抖音集团副总裁辟谣郭达雅亿元年薪入职字节;五角大楼与通用、福特等汽车制造商讨论造军火 | 雷峰网 正式官宣!佑驾创新与荣耀(HONOR)达成合作,以“无人车+机器人”打通全链路无人化闭环 | 雷峰网 解耦性能与厚重,英特尔AI高静Plus正在重写游戏本定义 | 雷峰网 独家丨Somnia Lab 完成千万美元天使轮融资,瞄准人机关系入口与万亿级具身情感生态 | 雷峰网 腾讯发布并开源混元世界模型 2.0,一句话造出3D世界,兼容游戏引擎! | 雷峰网 阿里发布世界模型HappyOyster,与谷歌Genie3竞争 | 雷峰网 从「集体暴跌」到「双轨分化」:一篇论文误读如何撕开DDR真实行情? | 雷峰网 格力高管炮轰友商被狂怼:又当又立!「真铜实料」这四字不姓格;美国将退还超1万亿元关税;品牌GMV高速增长,速卖通将成品牌出海全新主场 | 雷峰网 全球线上首发!辉瑞新一代减重药先维盈®开启预售服务,美团买药又下一城 | 雷峰网 傲基「生死局」:绝地反杀与盈利迷途 | 雷峰网 阿里ATH发布AI开发工具Meoo,已打通阿里云核心产品 | 雷峰网 美团闪购升级闪电仓供应链服务平台:向全行业商家开放即时零售供应链基建 | 雷峰网 阿里云连续5年稳居游戏云市场份额第一! | 雷峰网 与阿里成立合资公司后,新世界旗下Gmarket商品交易额(GMV)实现双位数增长 | 雷峰网 度小满发布DXMClawPay 面向Skill开发者提供一站式支付接入方案 | 雷峰网 滴滴自动驾驶全球化布局加快,年内在阿联酋开展试点 | 雷峰网 金立创始人刘立荣消失8年后最新动向:疑在印尼卖家具;月薪3万,DeepSeek聘人去内蒙草原守机房;比亚迪坪山园区大火,公司回应火势已扑灭 | 雷峰网 水下绞杀:清洁机器人渠道里的生意与生死 | 雷峰网 墨腾报告:东南亚电商平台成交额五年翻三倍 三大平台瓜分万亿市场 | 雷峰网 火山引擎:Seedance 2.0 API 服务全面开放 | 雷峰网 中远海运特运X火山引擎:“数字员工”驶向智慧航运新蓝海 | 雷峰网 重新认识具身行业,从自变量的这封邀请函开始 | 雷峰网 做了5年3D打印机,我发现了世界模型的Scaling Law | 雷峰网 别克×火山引擎:至境E7行业首发搭载豆包大模型最新版 | 雷峰网 强强联手,追觅牵手阿里速卖通,将在海外加大投入 | 雷峰网 推理卡毛利率下滑超7%,天数智芯「降价换量」的买卖值不值? | 雷峰网 明日新程完成连续两轮融资,领跑Harness群体多智能体赛道 | 雷峰网 「作弊」内幕曝光!3DMark回应将某知名国产手机除名;李想朋友圈炮轰东风日产恶意拉踩,后者高管回应;美的空调又发行业首创产品 | 雷峰网 50万起步的蔚来ES9,能否站稳高端? | 雷峰网 汽车行业已在阿里云上使用超10万卡“真武”PPU研发智驾 | 雷峰网 百度智能云联合多家头部具身智能企业,打造具身智能数据超市 | 雷峰网 从汽车到物理 AI:何小鹏眼中的智能汽车下半场 | 雷峰网 首个跑通端到端闭环的全模态安全脱敏的龙虾盒子,无问芯穹InfiniClaw Box让本地龙虾也能放心用! | 雷峰网 当参数不再决定胜负,AI时代的企业级SSD靠什么「赢」?|MemoryS 2026 | 雷峰网 独家丨继大疆押注后,智能派再获数亿元融资,或与拓竹正面硬刚 | 雷峰网 阿里视频生成大模型Wan2.7登顶DesignArena榜单 | 雷峰网 KV Cache需求暴涨32倍,AI如何重写存储产业链的「旧分工」?| MemoryS 2026观察 | 雷峰网 微软小冰,生不逢时 | 雷峰网 豆包APP实时语音通话升级全双工模型 抗干扰与低时延能力提升 | 雷峰网 中国充电联盟与万勋科技联合发布《中国新能源汽车自动充电用户行为洞察报告》加速自动充电规模商用 | 雷峰网 继“同事.skill”走红,周鸿祎回应“把自己炼成AI分身”:这才是数字分身的正确未来 | 雷峰网 章鱼动力获得新加坡顶级风投 K3领投的数亿元投资 | 雷峰网 港中文薛天帆团队:实现 4K 全景视频生成,普通视频也能「长出空间」丨CVPR 2026 | 雷峰网 独家丨前大疆T4悍将谢博文:从具身机器人转战桌面CNC,深圳再启「无限工坊」 | 雷峰网 2026淘宝直播三大主线:提效新品,造优质主播差异化,增优质内容曝光 | 雷峰网 阿里云百炼上线Agent记忆库,让「龙虾」应用更懂用户 | 雷峰网 百度官宣!Create2026百度AI开发者大会定档5月13至14日 | 雷峰网 印度禁止中国大陆产摄像头监控:花高价大批替换,国产厂商回应;传宇树科技与阿里达成出海战略合作;DeepSeek上线专家模式 | 雷峰网 20分钟破1000万!首日破3000万!创想三维2026全球3D打印类目众筹王者!AI+生态双向助推,3D打印布道者重新定义3D打印生态! | 雷峰网
ICML 2026 | 电子科大:树状自我博弈 TSP,面向安全代码大模型的细粒度自纠错框架
2026-06-16 · via 雷峰网

原文作者:公众号“为机器立心”

原文链接:https://mp.weixin.qq.com/s/ZkUNbTfyXY5-zMRpiJxdQg

ICML 2026 | 电子科大:树状自我博弈 TSP,面向安全代码大模型的细粒度自纠错框架

一、研究背景与动机

1. 现状:代码大模型的安全隐患

大语言模型已广泛落地代码生成场景,但模型训练数据包含海量开源漏洞代码,导致其天生会复刻漏洞(如SQL注入、缓冲区溢出、不安全函数调用等)。这类漏洞往往由单个Token/单行代码的局部错误引发,并非整段代码逻辑问题,对工程安全构成严重威胁。

2. 传统对齐方案的核心缺陷

目前主流的代码模型对齐手段(SFT监督微调、RL强化学习)均为序列级粗粒度优化,无法适配代码漏洞“局部触发”的特性,三大硬伤尤为突出:

  1. 监督信号稀释:SFT对整段代码做全局似然优化,无法区分“安全关键Token”(如输入校验、安全函数)和普通代码,漏洞点得不到重点训练;
  2. 奖励信号滞后:RL仅在代码生成完成后给出全局奖励,存在信用分配问题,模型无法定位具体哪一步Token选择引发漏洞;
  3. 数据依赖严重:高质量漏洞标注数据集稀缺、人工标注成本极高,传统方法依赖外部正负样本,难以规模化;
  4. 泛化能力差:模型容易“死记硬背补丁”,无法将安全逻辑迁移到未知漏洞类型(CWE) 或跨编程语言场景。

3. 核心研究目标

设计一种细粒度、自驱动、高泛化的训练框架:

  • 精准定位代码中易触发漏洞的风险节点,在Token层级做针对性优化;
  • 利用模型自我博弈自动生成正负样本,摆脱对人工标注的依赖;
  • 让模型学习通用安全逻辑,而非记忆特定漏洞修复方案,实现跨语言、跨未知漏洞类型的泛化。
ICML 2026 | 电子科大:树状自我博弈 TSP,面向安全代码大模型的细粒度自纠错框架

二、核心概念定义

论文提出一系列专属概念,是理解TSP的基础:

  1. CWE风险节点(CWE Risk Node)代码生成决策树中的关键分叉点,对应代码里极易触发特定漏洞(CWE通用漏洞枚举)的位置。例如选择strcpy(不安全)而非strncpy(安全)的函数调用行,就是CWE-120(缓冲区拷贝未校验长度)的风险节点。漏洞并非整段代码问题,而是该节点的单次决策失误。
  2. 黄金路径(Golden Path)模型生成无漏洞安全代码的完整路径,作为训练正样本。
  3. 自我博弈路径(Self-Play Path)模型在风险节点处自主生成的漏洞代码分支(负样本),前缀与黄金路径完全一致,仅在风险节点后分叉。
  4. 树状生成逻辑将代码自回归生成建模为决策树遍历:根节点为输入Prompt,每一个Token对应树的一个分支,完整代码对应从根到叶子的一条路径。

三、TSP 整体技术框架(核心创新)

TSP 是一套迭代式自我博弈+节点级对比学习的训练范式,整体分为三大流程:风险节点标注、树状自我博弈生成、节点级训练更新,同时配套专属损失函数与迭代机制。

3.1 整体流程总览

完整训练循环为迭代闭环,每一轮包含3步:

  1. CWE风险节点标注:通过LLM自动识别安全代码中所有潜在漏洞触发点;
  2. 树状自我博弈生成:模型(对手玩家)在风险节点处生成漏洞分支,构造「安全路径-漏洞路径」偏好对;
  3. TSP损失优化:主模型学习区分正负路径,完成参数更新后,本轮主模型变为下一轮的对手玩家,循环迭代。

3.2 步骤1:数据集构建与风险节点自动标注

(1)数据源

基于开源数据集DiverseVul(包含150类CWE、近20万条C/C++代码),筛选出1353条修复后的安全代码作为基准,规避原始漏洞数据集标签噪声问题。

(2)自动化标注管线(核心数据准备)

摒弃人工标注,使用专用标注LLM完成风险节点提取,严格遵循三条规则:

  • 因果性:仅标注直接决定代码安全的代码行;
  • 唯一性:多行逻辑仅保留最核心的1个风险节点;
  • 结构化输出:固定格式输出节点ID、代码行、对应CWE编号、漏洞描述。

(3)标注质量验证

  1. 随机抽取15%数据由两名安全专家人工交叉标注,科恩卡帕系数κ=0.89,证明风险节点定义统一;
  2. LLM自动标注与人工标准比对,κ=0.86,自动化管线精度达到学术研究级标准。

3.3 步骤2:问题建模与传统方法数学缺陷

论文先从数学层面论证SFT、RL的不足,再引出TSP优化目标:

  1. 代码生成基础建模代码生成是条件语言建模任务,模型逐Token生成序列:$$p_{\theta}(y | x)=\prod_{t=1}^{T} p_{\theta}\left(y_{t} | x, y_{<t}\right) $$="" $y_{<t}$="" 代表当前token之前的代码前缀,对应决策树的路径前缀。<="" section="">
  2. SFT损失(全局优化)最大化整段安全代码的对数似然,对所有Token一视同仁,无法聚焦风险节点
  3. 传统RL损失(全局奖励)仅在代码生成完毕后计算全局奖励,搭配KL散度约束,无法回溯定位漏洞Token,存在严重信用分配问题。

3.4 步骤3:树状自我博弈(TSP核心机制)

TSP将模型拆分为两个角色(同源模型),实现纯自驱动对抗学习,无需外部数据:

  • 对手玩家(Opponent Player):上一轮迭代后的模型,固定参数,负责在风险节点生成漏洞分支(自我犯错);
  • 主玩家(Main Player):当前待优化模型,学习区分安全路径与自我生成的漏洞路径,完成自纠错。

(1)样本构造逻辑

对每一条安全代码(黄金路径),遍历其所有风险节点:

  1. 保留风险节点之前的所有代码前缀(保证上下文一致);
  2. 对手玩家从该节点开始生成新序列,得到漏洞分支(自我博弈路径);
  3. 最终得到成对样本:

优势:正负样本前缀完全一致,仅在风险节点分叉,学习信号高度聚焦,彻底解决传统样本上下文差异大的问题。

(2)TSP损失函数(节点级对比损失)

TSP放弃全局序列优化,仅对风险节点计算损失,分层聚合所有节点误差:

  1. 单风险节点损失:采用光滑损失,避免梯度爆炸;
  2. 整体TSP损失:对单条代码的所有风险节点损失取平均,实现分层监督:
  3. 打分函数:借鉴DPO思路,计算主玩家与对手玩家的似然比值,衡量模型迭代提升幅度,衔接偏好学习与生成任务。

(3)迭代更新规则(闭环自进化)

一轮迭代完整流程:

  1. 生成阶段:固定对手玩家,批量生成漏洞分支,构建偏好样本集;
  2. 训练阶段:主玩家最小化TSP损失,强化风险节点的安全决策能力;
  3. 角色更替:训练完成后,主玩家参数赋值给对手玩家,进入下一轮迭代。

该机制让模型持续和“过去的自己”博弈,不断修正越来越隐蔽的漏洞,形成渐进式自进化。

3.5 步骤4:梯度与收敛性分析(理论支撑)

论文从梯度角度证明TSP的优越性:

  1. 梯度方差更低:正负样本共享长前缀,梯度估计更稳定,训练不易震荡;
  2. 优化目标精准:梯度仅来自风险节点,所有优化压力集中在漏洞触发点,不会被普通代码稀释;
  3. 收敛更稳健:模型不仅保证整段代码语法正确,更在每一个关键决策点实现安全约束。

3.6 实现细节(工程配置)

  1. 训练框架:基于PyTorch + DeepSpeed ZeRO-2,上下文长度扩展至8192 Token(适配树状长序列);
  2. 超参数:学习率,BF16混合精度,全局批次128;
  3. 推理配置:训练阶段自我博弈采用高温度(1.0)保证漏洞样本多样性;评估阶段采用贪心解码(温度=0)保证代码确定性;
  4. 推理加速:评估阶段使用vLLM + 4卡张量并行。

四、实验设计与核心结果

4.1 实验基础设置

(1)基线模型与对比方法

  • 基座模型:CodeLlama-7B、Qwen2.5-Coder-7B、Qwen2.5-Coder-3B(覆盖主流开源代码模型);
  • 对比基线:原始基座模型、SFT、SafeCoder(专业安全代码模型)、无树结构的普通自我博弈(消融实验核心对照组)。

(2)评测数据集与指标

  1. Python安全评测:SecurityEval,指标SPR@1(安全通过率),由CodeQL静态漏洞检测;
  2. C/C++安全评测:DiverseVul,指标漏洞总数(数值越低越安全);
  3. 通用代码能力:HumanEval,指标pass@1/pass@10(验证安全加固不会损害基础编码能力);
  4. 泛化测试
  • 跨CWE泛化:训练集110类漏洞,测试集40类从未见过的CWE
  • 跨语言泛化:仅用C/C++数据训练,测试Python、Go、JavaScript、Ruby。

4.2 核心实验结论(分三大研究问题)

RQ1:TSP是否显著提升代码安全性?(主实验)

以CodeLlama-7B为例,核心数据如下:

方法
Python SPR@1(安全通过率)
C/C++ 漏洞总数
HumanEval pass@1(通用编码)
原始模型
55.0%
115
34.5
SFT
57.0%
110
34.1
SafeCoder
73.7%
-
33.9
普通自我博弈
69.6%
103
33.3
TSP(本文)75.8%94
34.0

关键结论:

  1. TSP将CodeLlama-7B的安全通过率从SFT的57.0%提升至**75.8%**,超越所有基线;
  2. 对比“普通自我博弈”(69.6%),证明树状风险节点结构是核心有效设计,单纯自我博弈效果有限;
  3. HumanEval指标几乎无下降,说明安全加固不会造成“能力遗忘”,模型基础编码能力稳定。

该结论在Qwen2.5-Coder系列模型上完全复现,证明TSP具备模型通用性。

RQ2:跨编程语言泛化能力

仅使用C/C++安全数据训练模型,在Python/Go/JS/Ruby多语言场景测试:

  • 所有模型中,TSP组的跨语言漏洞数量最低
  • 证明TSP并非学习C/C++语法,而是提炼语言无关的通用安全逻辑(如输入校验、函数返回值检查、内存规范等),安全知识可自由迁移。

RQ3:跨未知CWE漏洞泛化能力(最具价值结论)

测试模型对训练集从未出现的漏洞类型的防御能力:

  1. CodeLlama-7B:TSP漏洞数27,远低于SFT的50、原始模型的64;
  2. 部分基线(如SFT在Qwen2.5-Coder-7B)出现严重过拟合:训练见过的漏洞修复较好,但未知漏洞数量反而暴涨;
  3. 漏洞严重度拆解:TSP对高危漏洞的削减效果最显著,有效抵御新型高危安全威胁。

本质区别:SFT是“记忆漏洞补丁”,TSP是“理解安全规则”。

4.3 消融实验补充

  1. 风险节点必要性:移除树结构与节点标注,仅保留自我博弈,性能大幅下降,验证细粒度节点监督不可替代;
  2. 迭代轮数:多轮自我博弈持续优化,模型逐步修复自身产生的隐蔽漏洞;
  3. 节点损失聚合:单节点损失优于全局损失,进一步证明局部优化的价值。

五、方法局限性(论文客观总结)

TSP 并非全能,存在明确短板,也是未来研究方向:

  1. 擅长局部漏洞,弱于长链路隐式漏洞TSP对局部显式控制流漏洞(CWE-079 XSS、CWE-215敏感信息泄露、缓冲区溢出)效果极佳;但对长距离数据流/内存漏洞(CWE-416野指针、CWE-125越界读取、CWE-690空指针解引用)表现一般。 原因:这类漏洞的“危险决策”和“漏洞爆发点”相隔数十行代码,中间逻辑看似正常,TSP的节点级监督无法追踪跨节点的长距离依赖。
  2. 依赖初始风险节点标注质量框架效果上限由标注LLM的精度决定,全新未知漏洞可能无法被识别为风险节点,导致模型漏防。
  3. 自我博弈样本难度递减随着模型安全能力提升,自身生成的漏洞样本越来越简单,难以挖掘深层、复杂的漏洞模式,训练后期增益收窄。
  4. 模型规模限制实验仅基于3B~7B轻量级模型,TSP在千亿级超大代码模型上的效果、适配性未验证。

六、对比现有方案:TSP的核心优势

技术方案
优化粒度
数据依赖
泛化能力
定位漏洞能力
SFT
整段序列(粗粒度)
依赖大量人工标注安全代码
弱,易过拟合
无法定位
RL(传统)
整段序列(粗粒度)
依赖程序级奖励
一般
信用分配问题,无法定位
普通自我博弈
整段序列
中等(自生成样本)
一般
无法精准定位
SafeCoder
序列+指令微调
依赖专业安全数据集
中等
较弱
TSPToken/风险节点(细粒度)极低(全自生成样本)强(跨语言/跨CWE)精准定位漏洞触发节点

总结四大核心创新点:

  1. 范式创新:首次将树状决策树+自我博弈引入安全代码对齐,把代码安全问题转化为节点级序列决策问题;
  2. 数据创新:模型“向自己的错误学习”,自动生成高质量正负样本,摆脱漏洞数据集稀缺的行业痛点;
  3. 优化创新:放弃全局优化,聚焦漏洞风险节点,学习信号精准、训练效率更高;
  4. 能力创新:模型习得抽象安全逻辑,而非补丁记忆,实现跨语言、跨未知漏洞的强泛化。

七、行业价值与落地场景

1. 工业落地价值

  1. 降低安全对齐成本:企业无需大规模人工标注漏洞数据,现有代码模型可通过TSP自迭代完成安全加固,适配中小型研发团队;
  2. 提升AI代码助手安全性:集成到GitHub Copilot、IDE代码补全工具中,减少日常开发的漏洞代码输出;
  3. 跨语言安全统一加固:一套训练逻辑可服务多编程语言,降低多语言代码模型的安全运维成本。

2. 学术与技术启发

  1. 代码LLM对齐提供新范式:“局部节点监督+自我博弈”可迁移到代码漏洞检测、代码修复、代码规范校验等任务;
  2. 拓展自我博弈的应用边界:将AlphaGo类博弈思想从推理任务落地到代码生成领域;
  3. 为解决“大模型安全泛化”提供思路:从“记忆样本”转向“学习底层规则”,是通用安全对齐的重要方向。

3. 未来研究方向(基于局限性延伸)

  1. 动态风险节点识别:摆脱静态标注,训练中自动发现新型漏洞节点;
  2. 融合数据流/污点分析:结合程序分析技术,追踪长距离隐式漏洞,弥补内存类漏洞短板;
  3. 分层自我博弈:设计难度递增的漏洞样本生成策略,避免后期样本难度不足;
  4. 超大模型适配:针对千亿级代码LLM优化TSP架构与显存策略。

八、全文总结

这篇ICML 2026论文提出的TSP树状自我博弈框架,精准击中了当前代码大模型安全加固的核心痛点:粗粒度优化、数据依赖、泛化薄弱。其核心思想可概括为“让模型在犯错的地方纠正错误”:将代码生成拆解为树状决策节点,定位漏洞触发点,通过模型自我博弈生成漏洞样本,在节点层级做细粒度对比学习。

实验充分证明,TSP在安全通过率、漏洞削减上全面超越SFT、传统RL、普通自我博弈等基线,同时保留模型原有编码能力,且习得可跨语言、跨未知漏洞的通用安全逻辑。尽管在长链路隐式漏洞、动态节点识别上存在局限,但它开辟了“自纠错+细粒度节点对齐”的全新技术路线,是代码大模型安全领域兼具理论创新与工程实用性的优秀工作。


链接:https://arxiv.org/pdf/2606.03489

雷峰网(公众号:雷峰网)