
追踪美国国会大厦遇袭前七个月内推特上信息的操纵情况。
三个要点
✔️ 2021年美国国会大厦遇袭前七个月推特上有组织的推文集群的可视化
✔️ 从5亿多条与选举有关的推文及其标签中检测用户集群
✔️ 文本相似度高的推文和用户之间的关系可视化发现攻击背后对推特信息的操纵,由
Tracking Fringe and Coordinated Activity on Twitter Leading Up To the US Capitol Attack
written by Padinjaredath Suresh Vishnuprasad, Gianluca Nogara, Felipe Cardoso, Stefano Cresci, Silvia Giordano, Luca Luceri
(Submitted on 9 Feb 2023)
Comments: AAAI 2023
Subjects: Social and Information Networks (cs.SI); Human-Computer Interaction (cs.HC)
code:![]()
![]()
本文所使用的图片要么来自论文、介绍性幻灯片,要么是参考这些图片制作的。
介绍
2021年1月6日,时任美国总统唐纳德-特朗普的支持者袭击了美国国会大厦,发生了导致5人死亡、多人受伤的悲惨事件。
该案件后来被认为是一场在网上策划和推动的未遂政变,该事件引发了人们对社交网络影响的重新认识,美国众议院成立了一个特别委员会,调查社交媒体在此案中的作用。
本文介绍了利用2020年7月至2021年1月期间收集的5亿多条与选举有关的推文数据集,将议会遇袭前7个月推特上的信息操纵情况以及它们之间的关系和产生的影响形象化这将被讨论。
数据集和边缘标签
本文收集了2020年7月至2021年1月的一系列推文,这些推文针对政治家,包括使用选举相关关键词的选举候选人。
基于随后收集的推文,我们创建了一个大型数据集,包括52%的转发、19%的回复、16%的原创推文和13%的引用。
我们还利用现有的研究和大量关于攻击国会大厦的报告,确定了由核心用户及其周围社区形成的19个标签(=Fringe Hashtags)。
边缘标签的细节和分布现在如下。
图中显示,Fring Hashtags可以分为三大类
- 美国大选:标签囊括了煽动欺诈性选举的言论
- QAnon:与美国右翼团体倡导的阴谋论和基于这些理论的政治运动有关的标签。
- COVID-19:与冠状病毒的阴谋论有关的标签。
此外,我们看到#stopthesteal(特朗普总统的支持者用来指责民主党人投票欺诈的标签)和#dobbs(用来回应支持政治评论家Lou Dobbs的评论的标签)是迄今为止分享最多的。
实验
利用创建的数据集,本文进行了以下三个实验,以可视化地了解在国会大厦遇袭前的七个月里,Twitter上的信息操纵情况以及它们之间的关系。
- 将快速传播的转发的互动网络可视化(快速转发网络)。
- 发现分享类似内容的推文的用户集群(CopyPasta网络)。
- HTEMap(Hashtag Temporal Evolution Mapping),是现有模型的延伸,用于绘制国会大厦遇袭前7个月的hashtag关系和时间趋势。
让我们逐一看一下。
快速转推网络。
转发是在Twitter上分享内容的最简单方式,但其简单性可能导致有组织的运动对信息进行恶意操纵。
因此,本文根据现有研究将快速转发网络可视化,目的是识别涉嫌通过快速转发进行系统性信息操纵的用户网络(快速转发)。
下图直观地展示了所创建的数据集中的快速转发网络,节点代表用户,边代表快速转发,节点的大小代表一个用户被转发的次数。
图中显示,快速转推网络由星形网络结构组成,这意味着一个用户被许多账户转推。
特别是,最近的文献表明,这种星形的互动结构很可能是有组织的在线操纵的证据,而手动识别这种结构中心的用户可以识别这种网络结构中具有影响力的用户据了解,。
CopyPasta网络。
与转发一样,高度相似的推文有可能被用来故意操纵某些想法或信息。
这些文字相似度高的推文在互联网上被称为CopyPasta推文,而由它们组成的网络被称为CopyPasta网络。
在本文中,CopyPasta网络是使用一个不定向网络构建的,该网络计算每条推文之间的相似度分数,如果它们高于一个阈值(=0.7),则将它们相互链接。
下图显示了通过这个实验建立的CopyPast网络,左边是基于标签的标记,右边是具有误导性选举相关内容的推文的标记。
节点代表推文,颜色代表推文中嵌入的标签,左边的绿色(占所有推文的76.25%)和右边的紫色(占所有推文的83%)是#stopthesteal和相关内容,这些CopyPasta推文占了大多数这些CopyPasta Tweets中的大多数是。
有趣的是,在这组用户中,只有少数(48人)与参与上述快速转发网络的用户有重合,这证实了这个实验导致了非常多样化的组织行为,而不仅仅是有限的特定用户。该实验证实了非常多样化的用户组织行为,而不仅仅是数量有限的特定用户。
HTEMap(Hashtag Temporal Evolution Mapping)。
最后,HTEMap(Hashtag Temporal Evolution Mapping)被用来可视化边缘Hashtags攻击国会大厦前七个月的时间序列变化。
HTEMap是Sato等人(2021)提出的模型的延伸,它通过映射时间序列中推文和标签之间的关系,建立标签的共同发生网络,来可视化标签随时间的变化。
这个实验所显示的HTEMap如下图所示。
图中的每个节点代表一个边缘标签,节点的大小代表标签的频率,边缘的厚度代表两个标签在HTEMap中共同出现的频率,节点的颜色代表时间序列。
从这个实验中,证实了在Twitter上形成了两个相互影响的社区(QAnon集群和与选举有关的集群)。最值得注意的是,内战标签与QAnon集群相互关联,这表明袭击国会大厦的背后可能涉及组织压力。此外,考虑到时间框架,与QAnon有关的标签比与选举有关的标签传播得更早,再次证实这种有组织的信息操纵很可能影响了选举。
摘要
它是如何做到的?在这篇文章中,我们描述了一篇论文,该论文利用2020年7月至2021年1月期间收集的5亿多条与选举有关的推文数据集,将议会遇袭前7个月内推特上的信息操纵以及它们之间的关系可视化,并调查它们的影响该论文还讨论了以下内容。
利用快速转发网络、CopyPasta网络和HTEMap进行的可视化,发现了几组可能参与系统性操纵信息的用户,结果表明选举背后有一个复杂的阴谋。
虽然本文只关注Twitter,但通过考虑其他平台可以取得进一步的进展,因为这将使分析更加全面。本文介绍的数据集和可视化方法的细节可以在本文中找到,如果你有兴趣可以查阅。
与本文相关的类别