


















论文题目:Dual-Kernel Graph Community Contrastive Learning
论文领域:图对比学习
论文发表:AAAI 2026
论文地址:https://arxiv.org/abs/2511.08287
论文代码: https://github.com/chenx-hi/DKGCCL
论文背景:

图对比学习(GCL)已成为在无任务特定标签的情况下训练图神经网络(GNN)的强大范式。然而,GNN 的密集消息传递机制以及正负节点对对比损失的二次计算复杂度,限制了其在大规模图上的可扩展性。为解决这些问题,我们提出了一个高效的 GCL 框架,将输入图转化为紧凑的互联节点网络,同时保留群落间的结构信息。我们首先引入了具有线性复杂性的核化图社区对比损失,实现节点集间的信息有效传递,以捕捉图的层级结构信息。随后,我们将知识蒸馏技术整合进解耦的 GNN 架构,以加速推理,同时保持强有力的泛化性能。在十六个不同规模的真实世界数据集上进行了大量实验,表明我们的方法在有效性和可扩展性方面均优于最先进的 GCL 基线。
GCL的核心思想是利用基于互信息最大化的对比损失来区分正负节点对。
GCL领域的当前的瓶颈在于
将图划分为多个社区,每个社区视为一个节点,从而得到一个粗化的图,将消息传递应用于粗化图,使得模型可以捕获长距离依赖关系,并显著降低计算复杂度。
一个典型的GCL是将相邻节点定义为正对,G的其他节点定义为负对。以确保相邻节点有着相似的表示

假设p={p1,..pm}是G的一个划分,包含m个社区。每个社区是v的一个子集。pi,j 是第i个节点在第j个社区中的权重。社区间的粗化图可以通过下面的公式构建

其中Aj,k是Pj和Pk之间的连接权重。
基于核的方法利用最优核函数k( , )来测量成对相似性,并已证明了在各种任务中非常有效。MKL方法通过结合多个核函数,从不同角度整合多样特征,由此产生的多核kn定义如下

其中gn是一个组合函数,给出两个核函数。gn的两种策略:核函数的张量积和核函数的凸线性组合。得到的张量积的方法定义为

本文的贡献
(1)通过整合多核学习,提出了双核图社区对比算是,提高了GCL训练的可扩展性
(2)引入了用于解耦GNN的知识蒸馏模块,以有效保留图结构信息并实现低延迟推理
(3)理论证明了核图社区对比损失可以为下游任务生成高质量的节点表示
(4)实验证明了有效性。
本文提出的GCCL(graph community contrastive learning)框架

基于核的GCCL
节点vi在Pj中可以由一个双层特征对 {vi, cj} 来表示

其中WG和Wp分别是两个不同的投影矩阵,用于将节点特征空间xG和社区特征空间xP映射到目标空间。
我们将社区级特征的构建视为从节点到社区质心的消息传递的过程,基于GNN消息传递机制Dropout,每一个分区Pj可以生成的不同划分子结构的期望数量为

双核GCCL损失
在获得双层特征后,如何使用简单的核技巧来加速GCL的计算过程。现有的GCL方法的成功在于强调节点表示的邻域相似性。
图社区对比损失可以表示为

其中Pj是vi所属的社区,而N(Pj)是在A中与Pj相连的社区集合。
上述的KB有助于整合节点和社区之间的信息,而A可以根据Pj和Pk之间的连接性调整正对样本的权重。
设置特征空间XG和Xp的非负核函数分别是KG和Kp,通过其特征映射表示为KG为KG,根据核函数的张量积

使用张量积方法的二核 GCCL 损失函数,MKL 的张量积方法能够在不同粒度级别的特征的所有维度上实现交互。
过度平滑问题是GNN的的表达能力构成关键挑战。我们研究了社区对比损失对节点平滑度的影响,并说明了整合关于G的先验信息的必要性。我们首先使用一个线性层,并通过我们的双核对比损失将社区信息融入这个线性变换过程。
图表示相似性蒸馏
采用知识蒸馏技术来避免GNN在推理过程中产生的显著计算开销。

理论分析
双核 GCCL 损失可以在k步图扩散矩阵上近似图对比损失。
通过图划分算法实现,因为这些算法本质上会最大化社区内部度数相对于外部度数的总和。
在异质性图中,扩展的感应域提供了无法在局部邻域(平滑)内捕获的额外信息。这意味着我们可以通过调整社区数量和局部邻域的范围来适应具有不同同质性水平的图。
蒸馏损失的性质
局部邻域表示Z可以看作是以Zy为中心的标准化高斯分布中采样得到的。
算法流程

整个训练过程分为两个阶段
在16个数据集上进行了评估,7个同质化图,7个异质化图,2个大规模图。
基线方法
经典GCL方法:
实验分为多个维度来评估算法
有效性评估
在同质图和异质图上进行了全面的节点分类实验

结果表明: (i) 我们的方法在不同同质性水平的图上表现出一致且优越的泛化性能。 (ii) 基于社区的方法,如 gCooL、CSGCL 和 E2Neg,在节点分类中显示出显著的竞争力,证实了在 GCL 中利用社区结构的有效性。 (iii) StructComp 在粗化图上进行对比学习,忽略节点级信息,这可能导致在节点级任务上的性能次优。
可扩展性评估:在大规模图上进行比较


基于简单的图划分算法和多核学习算法组合成为一种新的算法,双核图社区对比学习。
优势: 保持重要节点信息,以线性时间捕获社区级别结构特征。
图对比学习是当前比较火热的领域,其中双层核学习的嵌入显得有点突兀,并没有巧妙的算法设计和重构。
此内容由惯性聚合(RSS阅读器)自动聚合整理,仅供阅读参考。 原文来自 — 版权归原作者所有。