SNS上のフェイクニュース検出タスクにおけるSoTAモデルが登場!
3つの要点
✔️ Rumor Detectionのための新しいグラフベースのニューラルネットワークを提案
✔️ 会話のスレッドを画像、ノードをピクセル、複数のviewを画像チャンネルとして扱う事でviewごとの固有の特徴を学習
✔️ 2つのデータセットを用いた実験の結果、提案モデルが複数のstate-of-the-artモデルを超える性能を達成
Exploring Graph-aware Multi-View Fusion for Rumor Detection on Social Media
written by Yang Wu, Jing Yang, Xiaojun Zhou, Liming Wang, Zhen Xu
(Submitted on 8 Nov 2022)
Comments: Published on arxiv.
Subjects: Computation and Language (cs.CL)
code:
本記事で使用している画像は論文中のもの、紹介スライドのもの、またはそれを参考に作成したものを使用しております。
AI-SCHOLARイベント
AI技術は日進月歩で進み、皆さんもAI技術に関して多くのブームから衰退までを見ていると思います.そんな中,昨今のブームといえば,GPTからの大規模言語モデルだと思います.そこで,今回はAI-SCHOLARのメンバーを集めて,GPTの総論から話題にも上がるセキュリティ周りなどの技術者・研究者目線でのイベントを実施いたします.
はじめに
Rumor DetectionはSNS上のrumor(噂)を自動検出するタスクであり、フェイクニュースや風評被害の早期発見につながることから近年注目を集めています。
既存研究では、会話のスレッド(あるトピックに対する投稿や返信)から指標となる手がかりを学習することに焦点が当てられていましたが、これらの方法は様々なview(掲示板のようなスレッドの集まり)ごとに特徴をモデル化するだけで、複数のviewの特徴をうまく結合させることが出来ないという課題がありました。
本稿では、グラフ畳み込みネットワーク(Graph Convolutional Networks, GCN)に基づいて複数のviewを符号化し、畳み込みニューラルネットワーク(Convolutional Neural Networks, CNN)を用いて全てのview間の一貫性のある情報を融合させる新しいフレームワークであるGMVCN(Graph-aware Multi-View Convolutional Neural Network)を提案した論文について解説します。
Rumor Detection
SNSは人々が情報を入手し共有するために不可欠なプラットフォームとなっていますが、多くの課題が問題となっており、その中の一つにrumorの拡散が挙げられます。
rumorは、①正しい情報、②誤った情報(フェイクニュース)、③真偽が不明である情報がSNS上の人々の間で拡散する現象であり、SNSにはユーザーが生成したコンテンツに対する効果的な認証技術がないため、こうした問題はSNSの情報の信頼性を著しく低下させてしまいます。
SNS上の膨大な情報に対して、手作業で真偽の検証をするのは不可能であり、こうした問題を解決するために、会話スレッド内の情報の真偽を自動的に検出するタスクであるRumor Detectionが注目されてきました。
下図はあるツイートに対してのリツイートの伝播のトポロジー構造を表しており、左の2つがフェイクニュース(A false rumor)、右の2つが正しい情報(A true rumor)になります。
図から分かるように、フェイクニュースは通常の情報に比べてより多くの人の注目を集めなければすぐに広まらないため、その伝播はより拡散的になる可能性が高い傾向にあります。
またテキストの内容においても、フェイクニュースは多くの訂正を求めるコメントや問い合わせを受ける可能性が高く、正しい情報は人々によって支持される傾向があります。
本論文では、こうしたrumorのグラフ構造の違いからフェイクニュースを検出するための新しいフレームワークであるGMVCN(Graph-aware Multi-View Convolutional Neural Network)を提案しています。
GMVCN(Graph-aware Multi-View Convolutional Neural Network)
GMVCN(Graph-aware Multi-View Convolutional Neural Network)は下図のように、①Multi-View Embedding、②Multi-View Fusing、③Classificationの3つのコンポーネントから構成されています。
Multi-View Embedding
カラー画像は赤・緑・青のチャンネル(RGB)で表すことができ、各ピクセル位置はそれぞれRGBに対応する3つの値を持ちます。加えてコンピュータビジョンでは、RBGのViewの情報は画像分類などのタスクのためにCNNによって効率的に統合されます。
これをヒントにGMVCNでは、rumorの会話スレッドをカラー画像、各ノードを画素とみなして学習を行います。
上図のTop-down viewとBottom-up viewは画像の2つのチャンネルとみなされ、どちらのviewも初期値を持つノードの集合を共有します。
view固有の特徴を捉えるために、GCNを活用して個々のviewを符号化し、view固有の構造に従ってノードの埋め込みを更新しています。
Multi-View Fusing
Multi-View Embeddingの後に、CNNベースのサブモジュールを利用して、2つのview間の一貫性と補完性のある情報を取得し、予測のためのベクトルに融合させます。
Classification
最後に、学習された会話スレッドの表現をソフトマックス関数により正規化された層に接続することで、入力された会話スレッドの真偽を予測します。
Experiments
本論文では、GMVCNの性能を複数のベースラインと比較するための実験を行いました。
Datasets
本実験では、GMVCNの有効性を評価するために以下の2つの公開データセットを使用しました。
- SemEval-2017: training set・development set・test setの分割された325個の会話スレッドで構成されたデータセット。これらの会話スレッドは10種類のイベントに関連している。
- PHEME: 9種類のイベントに関連する2402個の会話スレッドで構成されたデータセット。
これらのデータセットに対して、各界において1つのイベントに関連する会話スレッドをテストに、他の8種類のイベントに関連する会話スレッドを訓練に使用したクロスバリデーションを実施しました。
Baselines
本実験ではGMVCNとの比較のために、以下の8つのベースラインモデルを使用しました。
- BranchLSTM: 会話スレッドの分岐をLSTM(Long Short-Term Memory)に基づきモデル化するアーキテクチャ
- TD-RvNN: 木構造の再帰的ニューラルネットワークを用いてTop-downの伝播構造をモデル化したアプローチ
- Hierarchical GCN-RNN: GCNとRNNを用いてスレッドの構造と時間的特性をそれぞれモデル化したアプローチ
- PLAN: ランダムに初期化されたTransformerを使用して会話スレッドを符号化したTransformerベースモデル
- Hierarchical Transformer: BERTの拡張モデルであり、Transformerに基づいて全ての会話スレッドの相互作用を符号化する
- Bi-GCN: 会話スレッドのTop-downとBottom-upのviewから高レベルの表現を学習するGCNベースのモデル
- ClaHi-GAT: 会話スレッドを無向グラフとして表現するGATに基づくモデル
- EBGCN: Bi-GCNの変形で、信頼性の低い関係の重みをベイズ法で調整するモデル
また、評価指標としてMacro-F1とAccuracyを使用しています。
Result
実験結果を下の表に示します。
このように比較実験より、2つのデータセットにおいてGMVCNは全てのベースラインモデルの中で有意に優れた性能であることが確認されました。
まとめ
いかがだったでしょうか。今回は、グラフ畳み込みネットワークに基づいて複数のviewを符号化し、畳み込みニューラルネットワークを用いて全てのview間の一貫性のある情報を融合させる新しいフレームワークであるGMVCN(Graph-aware Multi-View Convolutional Neural Network)を提案した論文について解説しました。
2つの実世界のデータセットを用いた比較実験により、GMVCNは既存モデルを凌駕する性能であることが確認され、現在問題となっているSNS上でのフェイクニュースへの対策として今後の動向に注目が集まります。
今回紹介したモデルのアーキテクチャやデータセットの詳細は本論文に載っていますので、興味がある方は参照してみてください。
この記事に関するカテゴリー