
在检测社交网站上的假新闻的任务中,SoTA模式正在兴起!
三个要点
✔️ 提出一个新颖的基于图的神经网络用于谣言检测
✔️ 通过将对话线程视为图像,节点视为像素,将多个视图视为图像通道,学习每个视图的独特特征。
✔️ 在两个数据集上的实验结果表明,所提出的模型优于多个最先进的模型
Exploring Graph-aware Multi-View Fusion for Rumor Detection on Social Media
written by Yang Wu, Jing Yang, Xiaojun Zhou, Liming Wang, Zhen Xu
(Submitted on 8 Nov 2022)
Comments: Published on arxiv.
Subjects: Computation and Language (cs.CL)
code:![]()
![]()
本文所使用的图片要么来自论文、介绍性幻灯片,要么是参考这些图片制作的。
介绍
谣言检测是一项自动检测社交网站上的谣言的任务,近年来引起了人们的关注,因为它导致了假新闻和谣言的早期检测。
现有的研究集中在从对话线程(主题的帖子和回复)中学习指示性线索,但这些方法只对各种视图(线程的集合,如告示板)中的每一个特征进行建模,无法成功地结合多个视图的特征这是一个挑战,因为它不可能成功地结合来自多个视图的特征。
本文描述了一个新的框架,GMVCN(Graph-aware Multi-View Convolutional Neural Network),它基于图卷积网络(GCN)对多个视图进行编码,并使用卷积神经网络(CNN)来融合所有视图的一致信息。本文描述了一个新的框架,GMVCN(图形感知多视图卷积神经网络),它融合了所有视图之间的一致信息。
谣言检测
社交网络已经成为人们获取和分享信息的重要平台,但一些问题已经成为问题,其中之一就是谣言的传播。
RUMOUR是指(一)正确的信息,(二)不正确的信息(假新闻)和(三)真实性不明的信息在SNS上的人们之间传播的现象,这些问题会大大降低SNS上信息的可靠性,因为SNS缺乏对用户产生的内容的有效认证技术。(四)未知的虚假信息。
人工验证社交网站上大量信息的真实性是不可能的,而Rumor Detection是一项自动检测对话线程中信息真实性的任务,作为解决这些问题的办法,已经引起了人们的关注。
下图显示了某条推文的转发传播的拓扑结构,左边的两个是假新闻(A false rumor),右边的两个是正确信息(A true rumor)。
从图中可以看出,与普通信息相比,假新闻的传播往往更容易扩散,因为它需要吸引更多的人注意才能迅速传播。
另外,在文本内容方面,假新闻可能会收到许多评论和更正的询问,而正确的信息往往会被人们所维护。
本文提出了一个新的框架,即GMVCN(Graph-aware Multi-View Convolutional Neural Network),用于根据这些谣言的图形结构的差异来检测假新闻。
GMVCN (Graph-aware Multi-View Convolutional Neural Network).
GMVCN(Graph-aware Multi-View Convolutional Neural Network)由三个部分组成:1)多视图嵌入,2)多视图融合和3)分类,如下图所示。这些组件是(1)多视图嵌入,(2)多视图融合和(3)分类。
多视图嵌入
彩色图像可以用红、绿、蓝通道(RGB)表示,每个像素位置有三个值,每个值对应一个RGB。此外,在计算机视觉中,RBG视图中的信息被CNN有效整合,用于图像分类等任务。
以此为提示,GMVCN将RUMOR对话线程视为彩色图像,每个节点为一个像素进行训练。
上图中的自上而下和自下而上的视图被认为是图像的两个通道,两个视图共享一组具有初始值的节点。
为了捕捉特定的视图特征,单个视图使用GCN进行编码,节点嵌入根据特定的视图结构进行更新。
多视角融合
在多视图嵌入之后,一个基于CNN的子模块被用来获取两个视图之间的一致和互补的信息,并将其融合成一个矢量用于预测。
种类
最后,对话线程的学习表征被连接到一个由softmax函数归一化的层,该层预测输入对话线程的真相。
实验
本文进行了实验,以比较GMVCN与几个基线的性能。
数据集。
本实验中使用了以下两个公开的数据集来评估GMVCN的有效性
- SemEval-2017:一个由325个对话线程组成的数据集,分为训练集、开发集和测试集。这些对话线程与10个不同的事件相关。
- PHEME:数据集由2402个与9个不同事件有关的对话线程组成。
在这些数据集上进行了交叉验证,使用与每个边界中的一个事件相关的对话线程进行测试,使用与其他八个事件相关的对话线程进行训练。
基线。
本实验中使用了以下八个基线模型与GMVCN进行比较
- BranchLSTM:一个基于LSTM(长短时记忆)的对话线程分支建模的架构。
- TD-RvNN:一种使用树状结构递归神经网络对自上而下的传播结构进行建模的方法。
- 分层GCN-RNN:一种使用GCN和RNN分别为线程的结构和时间属性建模的方法。
- PLAN:基于转化器的模型,对话线程使用随机初始化的转化器进行编码。
- 分层变换器:BERT的一个扩展,基于变换器对所有对话线程的互动进行编码。
- Bi-GCN:一个基于GCN的模型,用于从对话线程的自上而下和自下而上的视图中学习高级表征。
- ClaHi-GAT:一个基于GAT的模型,用于将对话线程表示为无向图。
- EBGCN:Bi-GCN的一个变种,是一个使用贝叶斯方法调整不可靠关系的权重的模型。
Macro-F1和准确度也被用作评价指标。
结果
实验结果如下表所示。
因此,比较实验证实,GMVCN在两个数据集上的表现明显优于所有基线模型。
摘要
它是怎样的?在这篇文章中,我们描述了一个新的框架,GMVCN(Graph-aware Multi-View Convolutional神经网络),这个新框架使用卷积神经网络来融合所有视图的一致信息。
在两个真实世界的数据集上进行的比较实验证实,GMVCN的性能优于现有的模型,并将成为未来关注的焦点,作为应对当前社交网站上假新闻问题的对策。
本文所介绍的模型的结构和数据集的细节可以在本文中找到,如果你有兴趣,应该查阅。
与本文相关的类别