GLA¶
Label-invariant augmentation for semi-supervised graph classification
-
motivation: 作者认为当前图对比学习性能受限的原因之一是破坏了标签不变性,因此作者通过在表征空间上进行数据增强而不是修改图结构和提取子图,来保持增强图与原始样本的标签不变性
-
主要增强方法: 在特征上增加随机偏移
-
encode:将图输入到 GNN encoder 中得到原始表征
-
表征增强:在得到的原始表征上进行多次的数据增强得到增强表征:作者首先计算中心表征,之后随机加到原始表征上 \(\(H^A = H^O + \eta d\Delta\)\) 其中 \(d\) 是中心表征,\(\Delta\) 是一个随机向量;最后通过classifier选出一个标签一致性最差的增强样本(为了提升泛化性)
-
使用一个classifier,输入原始表征和增强表征得到两者的标签,以确保标签不变性(对于label 图则直接比较原始标签)
-
使用一个 projection head,输入原始表征和增强表征,得到\(P^A, P^O\) 以最大化两者的一致性
-
loss: $$ \mathcal{L}P = \frac{-(PO)\top PA}{|PO|\cdot|P^A|}\ \mathcal{L}_C = -\sumc(Y_iO\log P_i^O + Y_i^O\log P_i^A)\ \mathcal{L} = \mathcal{L}_P + \alpha\mathcal{L}_C $$
-
-
方法评价: 崭新的数据增强方法,从表征上进行增强,维持了标签不变性