RW-NSGCN:通过负采样进行结构性攻击的稳健方法

论文地址

图结构网络通常包含拓扑扰动和权重扰动形式的潜在噪声和攻击,这可能导致 GNN 的分类性能下降。为了提高模型的鲁棒性,该论文提出了一种新方法:随机游走负采样图卷积网络(RW-NSGCN)。具体来说,RW-NSGCN 集成了用于负采样的随机游走(RWR)和 PageRank(PGR)算法,并采用基于行列式点过程(DPP)的 GCN 进行卷积运算。 RWR 利用全局和局部信息来管理噪声和局部变化,而 PGR 评估节点重要性以稳定拓扑结构。基于 DPP 的 GCN 确保负样本之间的多样性,并聚合其特征以产生鲁棒的节点嵌入,从而提高分类性能。


动机

目前的方法主要集中于聚合来自邻居的数据风险评估和模式识别的节点,其忽略来自非相邻节点的信息,这会间接影响网络的整体流量和权重分布。这种局部视角限制了它们响应拓扑变化和重量分布波动的能力。因此,理解非邻居节点之间复杂的关系对于开发更准确的分类模型至关重要。

一些研究,如SDGCN [ 25 ] ,引入了负采样机制,但其随机负采样方法未能充分利用节点和全局结构信息的重要性。因此,这些方法捕获非相邻节点之间复杂关系的能力有限,阻碍了对网络内节点全局影响力的准确评估。这反过来又影响节点表示和模型的整体稳定性。

**拓扑扰动:**这种攻击有选择地删除关键边缘,加剧图网络内自然发生的拓扑变化。它模拟极端情况下可能发生的碎片化和连接中断,旨在评估模型在面临重大结构扰动时的表现,并评估其处理现实网络复杂变化的能力。

**权重扰动:**这种攻击会修改边权重或引入随机噪声,以放大图中边权重的现有波动。该方法通过模拟极端权重扰动,评估模型处理信息流路径变化和节点影响力变化的鲁棒性,保证模型在动态环境下的可靠性。

方法

负样本的选取

首先,通过计算最短路径长度$d(v_i,v_j)$在节点对之间,我们可以确定两个节点之间的关系链长度。然后,我们为每个节点生成一组可达节点$v_i$在不同的路径长度$l:$
$$N_l(v_{i})={v_{j}|d(v_{i},v_{j})=l}$$
此步骤有助于识别与节点具有特定路径关系的节点集。

$$s_{ij}=\beta\cdot(1-\alpha)\left[(\mathbf{I}-\alpha\mathbf{P})^{-1}\mathbf{e}_i\right]_j+(1-\beta)\left[\alpha\mathbf{P}(\alpha\mathbf{P}\mathbf{p}+(1-\alpha)\mathbf{e})+(1-\alpha)\mathbf{e}\right]_j\quad\forall v_j\in\mathcal{N}_l(v_i),$$

其中$\mathbf{P}=\mathbf{D}^{-1}\mathbf{A}$ 是转移矩阵,$\alpha$是重启概率,$\beta$是RWR和PGR的权重参数。

基于这些综合评分向量,我们从不同路径长度的节点集中选择得分最高的节点作为候选节点:

$$\text{candidates}(v_i)=\bigcup\limits_{l = 1}^{L}\operatorname{top}({s_{ij}|v_j\in\mathcal{N}_l(v_i)})$$

通过整合不同距离的非邻居节点的关键节点信息,节点可以捕获多尺度特征,获取从局部到全局视角的多样化信息,从而更全面地表征其特征。此外,合并来自不同距离的节点的信息增加了信息多样性,避免了仅仅依赖局部邻域信息的局限性,从而提高了模型的鲁棒性和泛化能力。当包含来自更远距离节点的信息时,模型可以更好地理解全局结构,捕获全局模式并处理远程依赖性,特别是在本地信息不足时提供有价值的上下文信息。综上所述,该方法有效解决了图结构网络中的拓扑漏洞和权重不稳定问题,增强了整体稳定性和鲁棒性。

基于带有 DPP 采样的标签传播的 GCN

通过将行列式点过程(DPP)与图卷积网络(GCN)相结合,我们在保证节点多样性的同时,有效捕获节点和社区之间的特征关联,从而提高防御能力。

首先,模型使用DPP核矩阵来衡量节点对之间的关联强度,定义如下:
$$
L=Q\cdot(S_{com}\cdot S_{com}^{T})\cdot exp(S_{node}-1)\cdot Q^{T}
$$

在此背景下,L表示 DPP核矩阵,其中每个元素 $L_{ij}$表示节点之间的关联强度 $v_ i、v_j$和均选自 candidates(v)。

这 $s$ 矩阵由三种类型的相似度矩阵组成:

$$(S_{node})_{ij} = cos(x_i, x_j) = \frac{x_i \cdot x_j}{|x_i||x_j|}$$

$$(S_{com})_{ij} = cos(f_i, f_j) = \frac{f_i \cdot f_j}{|f_i||f_j|}$$

$$Q_{ij} = cos(c_i, f_j) = \frac{c_i \cdot f_j}{|c_i||f_j|}$$

第一条公式量化了特征空间内节点的相似度。

第二条公式衡量了社区特征之间的相似度。

第三条公式表示中心节点和社区特征之间的相似度。

上述步骤旨在有效捕获节点和社区之间的特征关系,获取节点和社区之间丰富的信息。

构建DPP核矩阵L后 ,进行采样,保证所选节点样本具有足够的代表性和多样性,避免节点选择出现偏差和过度集中。

DPP得到的负样本主要用在GCN消息传递阶段:

$$x_{\mathrm{pos}}^{(l+1)}=\mathrm{ReLU}\Big(\mathbf{W}^{(l)}\cdot\mathrm{normalize}(x^{(l)},\mathbf{D},\mathbf{A})\Big)$$

$$x_{\mathrm{neg}}^{(l+1)}=\mathrm{ReLU}(W_{\mathrm{DPP}}^{(l)}\cdot\mathrm{normalize}(x^{(l)},D_{\mathrm{DPP}},A_{\mathrm{DPP}}))$$

$$x^{(l+1)}=x_{\mathrm{pos}}^{(l+1)}-\lambda\cdot x_{\mathrm{neg}}^{(l+1)}$$

首先,我们使用标准的GCN卷积来传播正样本的特征,捕获正常行为的特征。

接下来,我们介绍 DPP 采样机制来选择负样本节点并传播其特征。

最后,通过减去负样本的特征(乘以平衡系数)来更新节点表示 $\lambda$)来自阳性样本。这种方法保证了所选节点子集在特征空间中是离散的,允许选择彼此不太相似的节点,从而避免冗余信息选择,有效防止过拟合,增强对图结构中异常行为的敏感性。


RW-NSGCN:通过负采样进行结构性攻击的稳健方法
https://lijianxiong.work/2024/20240814/
作者
LJX
发布于
2024年8月14日
许可协议