GraphCrop¶
-
motivation: 现在的 GNN 表征能力的提升有可能导致过拟合的问题,并且现实中的图很可能由于各种原因无法获取到完整的结构信息,因此作者希望设计一种数据增强方法,模拟省略一部分图结构,使得图分类器对于缺失部分图结构的情况下仍然能够正确分类,从而提升 GNN 的泛化能力
-
主要增强方法: 依概率选择出一部分图来增强,使用以节点为中心的策略裁剪出连通的一个子图
-
对于一个图,从所有节点的集合中均匀随机选择一个初始节点 \(v\)
-
评估 \(\mathcal{V}_i\) 节点集合中的节点到 \(v\) 的连通性(connectivity);作者使用扩散矩阵来评估节点连通性,作者采用了 PPR 作为图扩散的算法基础(在实验部分作者也测试了最短路径和heat diffusion)
-
从中随机按图的大小比例选出一部分数量的最高连通性的节点以及它们连接的边,从而裁出一张子图
-
-
方法评价: 相比较于随机去点和随机删边,GraphCrop 更加针对图分类任务,保全裁剪子图的连通性和基本结构,使得模型提升泛化性