摘要:
图表示学习的目标是将图中的每个顶点嵌入到低维向量空间中。现有的图表示学习方法可以分为两类:生成模型学习图中的底层连通性分布,以及判别模型预测一对顶点之间存在边的概率。在本文中,我们提出了一种将上述两类方法统一起来的创新图表示学习框架GraphGAN,其中生成模型和判别模型进行博弈论的极大极小博弈。具体来说,对于一个给定的顶点,生成模型会尝试在所有其他顶点上拟合其底层的真实连通性分布,并产生“假”样本来欺骗判别模型,而判别模型则会尝试检测采样的顶点是来自于”ground truth“还是由生成模型生成的。通过这两种模型之间的竞争,它们都可以交替迭代地提高各自的性能。此外,在考虑生成模型的实现时,我们提出了一种新的图softmax函数,以克服传统的softmax函数的局限性,可以证明它满足理想的归一化、图结构感知和计算效率等特性。通过在真实数据集上的大量实验,我们证明了GraphGAN在各种应用程序中取得了实质性的进展,包括在最先进的基线上进行链接预测、节点分类和推荐。
GraphGAN 结构图:

上图中绿色顶点代表正样本ptrue (·∣vc),蓝色条纹顶点代表生成器产生的顶点G(·|vc ; θG)。从上图的学习可以看出G 通过不断优化学习后,产生的顶点G(·|vc ; θG)与真实的ptrue (·∣vc) 几乎无法区分。
符号定义:G=(V,E) 表示给定图,V={V1,…,Vv}表示节点集,E表示边集。对于给定节点vc,N(vc)表示与vc直接相连的节点,ptrue (v∣vc)表示节点vc的真实连接分布,表示了节点vc的连接偏好。
生成器 G(v∣vc;θG):尽可能地去拟合或近似出真实的连接概率分布ptrue (v∣vc),从点集V中选择出最有可能与Vc连接的节点;生成器的目标是生成与vc真实的邻居节点尽可能相似的点,来欺骗判别器;
判别器 D(v,vc;θD):计算节点对之间存在连接的可能性;判别器的目标是判断这些节点哪些是vc的真实邻居,哪些是由生成器生成的节点;
目标函数:
!
通过V(G,D)交替最大化和最小化,可以学习生成器和判别器的最优参数。
实验结果:
1.连接预测:在链接预测中,我们的目标是预测两个给定顶点之间是否存在边。因此,本任务展示了不同图表示学习方法的边缘可预测性性能。我们在原图中随机隐藏10%的边作为ground truth,并训练下表所有的图表示学习模型。经过训练,我们得到所有顶点的表示向量,并使用逻辑回归方法预测给定顶点对的边存在概率。我们的测试集由原始图中隐藏的10%的顶点对(边)作为正样本,随机选择的不连接的顶点对作为等数的负样本。

2.节点分类:在节点分类中,每个顶点被分配一个或多个标签。在观察了一部分顶点和它们的标签之后,我们的目标是预测剩余顶点的标签。因此,节点分类的性能可以揭示在不同的图表示学习方法下顶点的可区分性。
