Skip to content

GraphAug

AUTOMATED DATA AUGMENTATIONS FOR GRAPH CLASSIFICATION

  1. motivation: 目前的图数据增强手段大多采用的统一的预设的处理手段,无法避免破坏图中的标签相关信息,因此作者基于强化学习开发出一种可以自动产生标签不变性(label invariance)的数据增强,应用到图分类问题当中

  2. 主要增强方法: 通过强化学习来优化模型以最大化估计的标签不变概率,采用sequential transformation来进行数据增强;即将采样的原始图进行一系列增强得到最终的增强图GraphAug

    • GNN encoder:提取特征:首先设置一个virtual node与输入图的所有节点相连,其特征是可训练的

    • 选择增强手段:将virtual node的embedding输入到一个 GRU 中产生增强的类别,再输入到一个 MLP 依概率选择一个合适的增强手段:其中主要采用 特征遮蔽、去除节点、边扰动 三种增强手段,每个增强手段还有对应的 MLP 来决定进行不同程度的增强

  3. 方法评价: 通过类似于强化学习的方式使得每次选取的增强手段尽量不破坏标签语义信息,从而达到目的;通过强化学习的方式训练奖励模型,容易不稳定发散;模型较为复杂,计算效率可能高;在实际应用中,该算法适用于对于标签语义信息敏感的图数据,例如,化学分子图对于标签语义信息很敏感,因此这种维护标签不变性的自动增强很有帮助