アメリカ合衆国議会議事堂の襲撃事件までの7ヶ月間のTwitter上の情報操作を追跡

survey 2023年06月08日

3つの要点
✔️ 2021年のアメリカ合衆国議会議事堂の襲撃事件までの7ヶ月間のTwitter上の組織的なツイート群を可視化
✔️ 5億件以上の選挙関連のツイートとそのハッシュタグからユーザーのクラスタを検出
✔️ テキスト類似度の高いツイートとユーザーの関係性を可視化することで、襲撃事件の背景にあったTwitter上の情報操作を発見

Tracking Fringe and Coordinated Activity on Twitter Leading Up To the US Capitol Attack
written by Padinjaredath Suresh Vishnuprasad, Gianluca Nogara, Felipe Cardoso, Stefano Cresci, Silvia Giordano, Luca Luceri
(Submitted on 9 Feb 2023)
Comments: AAAI 2023
Subjects: Social and Information Networks (cs.SI); Human-Computer Interaction (cs.HC)

code：

本記事で使用している画像は論文中のもの、紹介スライドのもの、またはそれを参考に作成したものを使用しております。

はじめに

2021年1月6日、当時のアメリカ大統領であるドナルド・トランプ氏の支持者によりアメリカ合衆国議会議事堂が襲撃され、5名の死者と大勢の負傷者を出すという痛ましい事件が起こりました。

本事件はその後、オンライン上で組織・推進されたクーデター未遂事件とみなされ、アメリカ合衆国下院が本事件に関連するソーシャルメディアの役割を調査する特別委員会を設置するなど、SNSが与える影響の大きさが再認識されるきっかけを与える事件になりました。

本稿では、2020年7月から2021年1月にかけて収集された5億件以上の選挙関連のツイートのデータセットを活用し、議事堂襲撃までの7ヶ月間で行われたTwitter上での情報操作とその関係性を可視化し、それらがもたらした影響についての調査を行った論文について解説します。

Dataset & Fringe Hashtags

本論文では、2020年7月から2021年1月までのツイートのうち、選挙に関連するキーワードを用いた選挙の立候補者を含んだ一連の政治家に向けたツイートを収集しました。

その後収集したツイートを基に、52%がリツイート(retweets)、19%がリプライ(replies)、16%がオリジナルツイート(original tweets)、13%が引用(quotes)で構成される大規模データセットを作成しました。

また、既存研究および議事堂襲撃事件に関する多数の報告を活用し、中心となるユーザーおよびその周辺コミュニティによって形成された19個のハッシュタグ(＝Fringe Hashtags)を確認しました。

Fringe Hashtagsの詳細および分布は以下のようになりました。

図より、Fring Hashtagsは主に以下の3つに大別されている事がわかります。

US Election: 不正選挙を扇動するコメントを包含するハッシュタグ
QAnon: アメリカの右翼派が提唱している陰謀論およびそれに基づく政治運動に関連するハッシュタグ
COVID-19: コロナウイルスについての陰謀論に関連するハッシュタグ

加えて、#stopthesteal(トランプ大統領の支持者が民主党の投票不正を非難する際に使用されたハッシュタグ)と#dobbs(政治評論家であるLou Dobbsを支持するコメントに対して使用されたハッシュタグ)が圧倒的に多くシェアされている事がわかります。

Experiments

本論文では、作成されたデータセットを用いて、議事堂襲撃までの7ヶ月間で行われたTwitter上での情報操作とその関係性を可視化するために以下の3つの実験が行われました。

急速に拡散するリツイートの相互作用ネットワーク(Rapid Retweet Network)を可視化する
類似する内容のツイートを共有するユーザーのクラスタ(CopyPasta Network)を発見する
既存モデルを拡張したHTEMap(Hashtag Temporal Evolution Mapping)により、議事堂襲撃までの7ヶ月間のハッシュタグの関係性と時間的な推移をマッピングする

一つずつ見ていきましょう。

Rapid Retweet Network

リツイートはTwitterにおける最も簡単なコンテンツ共有方法ですが、そのシンプルさゆえに組織的な動きによる悪質な情報操作につながる恐れがあります。

そこで本論文では、迅速なリツイート(Rapid Retweet)により組織的な情報操作をしている疑いのあるユーザーのネットワークを特定することを目的として、既存研究に従ってRapid Retweet Networkの可視化を行いました。

下図は、作成されたデータセットにおけるRapid Retweet Networkを可視化したものであり、ノードがユーザーを、エッジがRapid Retweetを、ノードの大きさはユーザーがリツイートされた回数を表しています。

図より、このRapid Retweet Networkはスター型のネットワーク構造で構成されており、一人のユーザーが多数のアカウントからリツイートされている事が分かります。

特に近年の文献により、このようなスター型の相互作用構造は組織的なオンライン操作が行われた証拠である可能性が高いことがわかっており、このような構造の中心となっているユーザーを手動で特定することで、このネットワーク構造内で影響力の高いユーザーを特定することができると考えられます。

CopyPasta Network

リツイートと同様に、類似性の高いツイートはあるアイデアや情報の意図的な操作のために使用される危険性があります。

こうしたテキスト類似度の高いツイートをインターネット用語でCopyPasta Tweet、それらで構成されたネットワークをCopyPasta Networkと呼びます。

本論文では、各ツイート同士の類似度スコアを計算し、閾値(＝0.7)以上であれば互いにリンクする無向ネットワークを用いてCopyPasta Networkを構築しました。

下図は、本実験により構築されたCopyPast Networkであり、左がハッシュタグに基づいてラベル付けしたもの、右が選挙に関連する誤解を招く内容のツイートに対してラベル付けしたものになります。

ノードがツイート、色がツイートに埋め込まれたハッシュタグを表しており、左図の緑色(全体の76.25%)および右図の紫色(全体の83%)が#stopthestealおよびそれに関連する内容になっており、これらのCopyPasta Tweetが大半を占める結果となりました。

興味深い点は、このユーザー群において、前述のRapid Retweet Networkに関与するユーザーとの重複が見られるのはわずか(48人)であることであり、本実験により限定された特定のユーザーだけでなく非常に多様なユーザーが組織的な行動を行っていることが確認できました。

HTEMap(Hashtag Temporal Evolution Mapping)

最後に、HTEMap(Hashtag Temporal Evolution Mapping)を用いてFringe Hashtagsの議事堂襲撃前の7ヶ月間の時系列変化の可視化を行いました。

HTEMapは、Sato et al.(2021)で提案されたモデルを拡張したものであり、時系列にツイートとハッシュタグの関係をマッピングし、ハッシュタグの共起ネットワークを構築することでハッシュタグの時系列変化を可視化します。本実験により可視化されたHTEMapを下図に示します。

図の各ノードはFringe Hashtagsを、ノードの大きさはハッシュタグの頻度を、エッジの太さはHTEMapにおける2つのハッシュタグの共起の頻度を、ノードの色は時系列を表しています。

本実験より、Twitter上で相互作用している2つのコミュニティ(QAnon clusterとElection-related cluster)が形成されていることが確認できました。

最も注目すべきなのはcivilwarのハッシュタグがQAnon clusterと相互に関連している点であり、このことから議事堂襲撃の背後には組織的な圧力が関与していた可能性が考えられます。また、時間軸を考慮するとQAnon関連のハッシュタグが選挙関連のハッシュタグよりもずっと早い時期に広まっており、こうした組織的な情報操作が選挙に影響を与えた可能性が高いことが改めて確認できました。