Bi-GCN：基于双向图卷积网络的社交媒体谣言检测

如题所述

第1个回答 2022-07-28

传统的谣言检测方法缺乏从谣言的 传播（propagation） 和 扩散（propagation） 结构中学习的高层表示。最近的研究已经开始从谣言的传播结构中学习高层表示，比如RvNN等方法。然而这些方法只关注谣言的传播却忽略了谣言扩散的影响。虽然一些方法已经开始尝试使用CNN来引入谣言扩散信息，但是基于CNN的方法只能捕获局部邻域的相关特征，却不能处理图或树结构中的全局结构关系，因此谣言扩散的全局结构特征在这些方法中被忽略了。事实上CNN也并非被设计用来从结构化的数据中学习高层特征，不过图卷积网络（Graph Convolutional Network,GCN）可以做到。

GCN已经在很多领域取得了成功，不过我们不能简单地将GCN应用到谣言检测任务上。如下图(a)所示，GCN，或者称为无向GCN（UD-GCN）聚合信息只依赖相关帖子的关系却丢失了贴子之间的顺序关系：

UD-GCN虽然可以处理谣言扩散的全局结构特征，但是忽略了谣言传播的方向。沿着关系链的深度传播与社区群体内部的广度扩散是谣言的连个主要特点，因此需要一个方法来同时处理这两种传播方式。

本文提出了Bi-GCN方法来同时处理谣言的传播与扩散。Bi-GCN同时在top-down和bottom-up的图结构上进行操作，具体的通过top-down GCN（TD-GCN）来处理谣言的传播，以及通过bottom-up GCN（BU-GCN）来处理谣言的扩散。如上图(b)(c)所示，TD-GCN从父亲节点到子节点前向传播信息来模拟谣言的传播，BU-GCN从节点的子节点聚合信息来表示谣言的扩散过程。

使用代表谣言检测数据集，代表第个事件，是事件的数量，，代表帖子的数量，是原帖子，是第个相关回复的帖子，代表传播结构。具体的，被定义为一个图，是根节点，代表从被回复的帖子到转发帖子或回复帖子的边的集合（如上图(b)）。举例来说，如果回复了，那么将有一条有向边，也就是；如果回复了，那么将有一条有向边，也就是。定义为邻接矩阵：

是帖子的特征矩阵，采用top-5000词的TF-IDF值作为帖子的特征向量。对于每个，都被关联的其真实性标签（False Rumor和True Rumor)），有时也有更细粒度的分类（Non-rumor, False Rumor, True Rumor, Unverified Rumor）。给定数据集，目的是学习分类器来进行谣言检测。

GCN的卷积操作被看做是一个消息传递（message-passing）的结构：

是第层的图卷积层（Graph Conventional Layer,GCL）计算得到的隐层特征矩阵，是信息传递函数，是训练参数矩阵。

本文采用的GCN采用第三代GCN，也就是 Semi-Supervised Classification with Graph Convolutional Networks 中提出的GCN架构，参考链接：第三代图卷积网络：使用图卷积网络进行半监督分类。

按照上面的GCN结构，图卷积层定义为：

其中，，代表第个节点的度，，代表激活函数，比如ReLU。

DropEdge是用来减少基于GCN的模型过拟合的方法。在每个训练epoch中，按照一定概率随机丢掉一些边来为输入数据引入一些随机性和多样性。假设图边的总数为，丢弃率为，DropEdge以后的邻接矩阵就变为：

是使用随机采样的边构成的矩阵。

Bi-GCN的核心思想是学习谣言传播和扩散的高层表示，在本文中采用的GCN都是用两层上述图卷积层。下图展示了模型的整个流程，主要分为4步：

对于一个事件，构建它的传播图结构，和分别是邻接矩阵和特征矩阵，只包括前面图(b)中从上到下的边。每个训练epoch中都会按照几率来获得。以和为基础，构建Bi-GCN模型，Bi-GCN包括两种，top-down GCN（TD-GCN）和bottom-up GCN（BU-GCN），两种GCN的邻接矩阵是不同的，采用的特征矩阵是相同的。对于TD-GCN，，而对于BU-GCN，。

将和应用到前面的图卷积过程，一共有两个图卷积层：

这里代表TD-GCN两个图卷积层的隐层特征。是TD-GCN的卷积核参数矩阵。采用ReLU作为激活函数，同时在图卷积层上应用Dropout。

与TD-GCN采用类似的过程得到和。

事件的源帖子通常包含丰富的信息，能够产生广泛的影响，因此有必要更好地利用源帖子的信息来学习节点和源帖子之间更精确的节点表示。本文提出了一种根节点特征增强的策略来更好地利用源帖子信息。具体的，对于TD-GCN的第层，我们拼接第层每个节点的隐层特征向量和第层的根节点特征向量来构建一个新的特征矩阵：

有。按照上述规则，再计算时用代替，然后得到：

类似地，以同样的方式获得和。

谣言的传播和扩散表示通过聚合TD-GCN和BU-GCN的节点表示来获得，采用mean-pooling的方式：

然后拼接这两个表示：

接着通过多个全连接层和softmax层进行预测：

这里是所有类的概率。训练时使用交叉熵损失并且应用L2正则化，使用随机梯度下降SGD和Adam优化器进行训练。

在Weibo,Twitter15,Twitter16三个数据集上进行实验，数据集统计如下：

以下是在三个数据集上的结果：