通过关注双重连接性，显著提高图神经网络的性能

GNN 31/05/2024

三个要点

✔️ 重点关注图双连通性的表现力，这在图神经网络（GNN）中尚未得到广泛关注
✔️ 发现现有的 GNN 对双连通性的表现力较差。
✔️ 提出了 Graphormer-GD，作为一种基于变换器的快速 GNN，对双重连接性具有充分的表达能力。

RETHINKING THE EXPRESSIVE POWER OF GNNS VIA GRAPH BICONNECTIVITY
written by Bohang Zhang, Shengjie Luo, Liwei Wang, Di He
(Submitted on Submitted on 23 Jan 2023 (v1), last revised 11 Feb 2024 (this version, v3))
Comments: Extended from ICLR 2023 Outstanding Paper; 60 pages, 12 figures. Fix typos in the previous version
Subjects: Machine Learning (cs.LG); Machine Learning (stat.ML)

code：

本文所使用的图片要么来自论文、介绍性幻灯片，要么是参考这些图片制作的。

介绍

图神经网络（GNN）由 Gori 和 Scarcelli 于 2005 年首次提出。图是一种关系，由顶点（节点）和连接顶点的边（边）表示。GNN 的目的是根据给定数据的图结构，学习汇总每个节点相邻节点特征的特征。

例如，根据学习到的特征，可以预测每个节点的标签；使用 GNN 的效果是，根据节点在图中的邻近程度，也更容易成功猜测节点的未知标签。

然而，根据给定数据的图结构，每个节点的邻居特征是如何聚合的，可能会学习到无法反映图结构差异的特征。

简而言之，当根据不同的图结构学习特征时，期望学习到的特征应该是不同的，但根据 GNN 的类型，有可能根据不同的图结构学习特征，但得到的特征是相同的。

Weisfeiler-Lehman 检验（WL 检验）经常被用来比较此类 GNN 图的表达能力。同构是指图的连接方式相同，只是图节点的排列方式不同。这意味着它们的不同之处仅在于编号方式，即识别图的节点。

WL 检验是 1968 年提出的一种经典方法，用于确定这些图形的同构性。该测试方法是，如果按照一定的规则给图的节点着色，则具有相同颜色直方图的图将被判定为同构。虽然它的缺点是节点数和度相同的图都被认为是同构的，但它被认为是一种快速而强大的判断方法。

虽然有很多关于 GNN 的研究都探讨了是否有可能通过学习特征来正确判断图的同构性，从而使其与 WL 测试一样好或更好，但目前还没有关于 GNN 的研究侧重于图的双重连通性。

与此相反，本文重点关注图双连接性。它研究了现有 GNN 方法在图对偶连通性方面的表现力，发现大多数方法在图对偶连通性方面缺乏表现力。

此外，Graphormer-GD 是一种基于变换器的高效计算 GNN，在图的双重连接性方面具有很强的表现力。这使得它在实际问题的基准测试中表现出了很高的性能。该论文被选为 2023 年 ICLR 优秀论文。

下文将介绍图形的双重连通性、WL 测试、GD-WL 和 Graphormer-GD 及其评估结果。

图形的双重连通性

我们解释说，本文介绍的重点是图的对偶连通性，但是图具有对偶连通性首先意味着什么？

图的双连通性指的是，如果从图中删除一个节点（或边），图的连通性（即所有节点都可以从图中的一个节点通过边追溯到所有节点）将保持不变。

如果即使节点被排除在外也能满足，则称为节点双重连通性；如果即使边缘被排除在外也能满足，则称为边缘连通性。

反之，如果移除图形中的一个节点会导致其失去连通性，则该节点被称为切割节点。如果删除一条边会使其失去连通性，那么这条边就被称为切割边。

切割节点和切割边的示例如图 1 所示。

图 1. 图形的对偶连通性 (a) 原始图形 (b) 切边树 (c) 切节点（顶点）树

图 1 (a) 显示了原始图形。图 1 (b) 中显示的红色边是一条切割边。删除这条剪切边会使图形失去连接性。图 1 (c) 中的橙色边节点是一个切割节点。移除该节点会导致图形失去连通性。

图的双连通性本身就是图论中长期备受关注的一个特性。在应用方面，以通信网络为例，如果通信网络上的某个设备发生故障，通信就会中断。因此，在创建通信网络时，必须确保不存在被切断的节点。从这个意义上说，它可以成为现实世界中的一个重要属性。

对于此类预测任务，图的双重连通性是一个重要特征，因此使用无法表示图的双重连通性的 GNN 预计会大大降低预测准确率。

WL 测试（色彩调整算法）

WL 测试有多种类型，本节将介绍最基本的一阶 WL 测试，并解释其难点在于不能很好地识别双连接性。

一阶 WL 测试

一阶 WL 检验也被称为色彩细化算法。

首先，如果节点没有颜色，则用明显的颜色对其进行初始化。例如，如果图是一个分子结构，那么初始化时，当原子被视为节点，原子之间的键被视为边时，不同的原子名称就会被赋予不同的颜色。

接下来，为每个节点创建一对自己的颜色和一个相邻节点颜色的多集合（这个集合可能包含多个相同元素）。对于每个节点的颜色对（自己的颜色、相邻节点颜色的多集合），给唯一的颜色对赋予不同于前一个颜色对的颜色，并进行一一对应。重复这一过程，直到调整前后的颜色不再相同。

对于两个图形，比较图形末端的颜色直方图，如果相同则判定为同构，否则判定为非同构。

通过一阶 WL 检验双连接的可识别性

在考虑 GNN 的表达能力时，关注双重连通性的一个原因是，在某些情况下，一阶 WL 检验无法识别双重连通性。

在一些例子中，一阶 WL 检验无法识别具有对偶连通性的图中的同构，如图 2 所示。

图 2：在 WL 测试中无法确定具有双重连接性的图形是否同构的示例（即具有不同连接性的图形被判定为同构）。

在图 2 中，第一行的图是具有双重连通性的图，其中红色边框的节点是剪切节点，红色线条是剪切边；第二行的图是不具有双重连通性的图，其中红色边框的节点是剪切节点，红色线条是剪切边。将(a)~(d)行中的图相互比较，它们的连接方式各不相同。换句话说，它们是非同构图形。然而，在 WL 检验中，由于颜色直方图（每种颜色出现的次数）相同，它们被误判为同构。

因此，简单的 WL 检验并不能充分代表双重连通性，所以我们需要一种能够代表具有双重连通性的图形的 WL 检验。