Skip to content

GAUG

Data Augmentation for Graph Neural Networks

  1. Motivation:在图节点分类任务上,作者探究删除哪些的噪声边和增加哪些缺失边从而可以实现数据增强,来提高GNN性能

  2. 主要增强方法:使用边预测器实现图重连 GAUG-O

    • GAUG-M: 首先用一个边预测器得到图中所有可能存在的边和已经存在的边的概率,作者采用了 GAE,之后使用以下过程:

      \[ M = \sigma(ZZ^\top), \operatorname{where} Z = f^{(1)}_{GCL}(A, f^{(0)}_{GCL}(A, X)) \]

      其中 \(X\) 是特征矩阵,最终得到 \(M\) 是边的概率矩阵。之后就可以通过 \(M\) 增删边得到增强的图Gm,交给GNNs去节点分类

    • GAUG-O:与上者类似,只是不是直接用Gm,而是和原图进行采样产生一个新图用于训练,最后推理的时候直接用原图,从而实现端到端

  3. 实验

  4. 为了证明可以提高GNNs的表现,对比同样对边进行操作的增强手段,用于不同GNN模型进行不同数据集的分类后的结果准确率

  5. 增强类簇内和类簇间边的关系:看类内的边是否增加和类之间的边是否减少: GAUG可以看到使用GAUG-M进行数据增强后,图中 intra-class 边的数量增加的远多于减少的,而inter-class边的数量减少的比增加的多。对比图右边随机增减边,模型性能有显著提高