FRCSyn Challengeが示す合成データセットによる顔認識技術の可能性（FRCSyn Challenge at WACV 2024: ）

Face Recognition 2023年12月11日

3つの要点
✔️ 顔認識技術はプライバシーやデータ不均衡の問題があり、合成データセットの活用がこれらの課題への対策として提案されている。
✔️ この新しいチャレンジでは、合成データセットを活用して顔認識モデルの性能を評価し、実データセットとの比較を行っており、合成データセットの有用性を分析している。
✔️ RCSyn Challengeの結果、合成データセットが顔認識技術の人種バイアスを軽減し、全体的な性能を向上させる可能性を示し、さらに、合成データセットと実データセットの組み合わせが有効であることを示している。

FRCSyn Challenge at WACV 2024:Face Recognition Challenge in the Era of Synthetic Data
written by Pietro Melzi, Ruben Tolosana, Ruben Vera-Rodriguez, Minchul Kim, Christian Rathgeb, Xiaoming Liu, Ivan DeAndres-Tame, Aythami Morales, Julian Fierrez, Javier Ortega-Garcia, Weisong Zhao, Xiangyu Zhu, Zheyu Yan, Xiao-Yu Zhang, Jinlin Wu, Zhen Lei, Suvidha Tripathi, Mahak Kothari, Md Haider Zama, Debayan Deb, Bernardo Biesseck, Pedro Vidal, Roger Granada, Guilherme Fickel, Gustavo Führ, David Menotti, Alexander Unnervik, Anjith George, Christophe Ecabert, Hatef Otroshi Shahreza, Parsa Rahimi, Sébastien Marcel, Ioannis Sarridis, Christos Koutlis, Georgia Baltsou, Symeon Papadopoulos, Christos Diou, Nicolò Di Domenico, Guido Borghi, Lorenzo Pellegrini, Enrique Mas-Candela, Ángela Sánchez-Pérez, Andrea Atzori, Fadi Boutros, Naser Damer, Gianni Fenu, Mirko Marras
(Submitted on 17 Nov 2023)
Comment: WACV 2024 Workshops
Subjects: Computer Vision and Pattern Recognition (cs.CV)

code：

本記事で使用している画像は論文中のもの、紹介スライドのもの、またはそれを参考に作成したものを使用しております。

概要

顔認識技術は、監視カメラ、入出国管理、オンライン本人認証、スマートフォンのロック解除などで様々な用途で利用されています。これまで非常に多くの研究が行われてきました。近年のディープラーニング技術の進歩や、マージンベースの損失関数の定式化、大規模データセットの整備など様々な要因によっての顔認識技術の普及が進んでいます。しかし、それと同時に、さまざまな課題も出てきています。特にデータセットにおいてさまざまな課題があります。例えば、顔画像を扱うため、プライバシーの問題があります。また、依然として学習データセットが限られていること、ノイズの多いラベリング、異なるアイデンティティと人口統計グループに関連する不均衡、低解像度など、多くの課題があります。

このような課題を克服するために、近年、合成データセットを構築するアプローチが盛んに研究されています。高精度な顔画像を合成することができれば、プライバシーの懸念を解消することができます。また、解像度や人口統計も自由に制御することができます。

この論文では、近年盛んに研究されている合成データの有用性を検証するために、合成データで学習した顔認識システムの性能を評価する「FRCSyn Challenge」という顔認識チャレンジ（ベンチマークテスト）を実施し、その結果を分析します。

FRCSyn Challengeでは、参加者に「DCFace」と「GANDiffFace」の2つのSOTAのモデルを使用して生成された合成データベースが公開され、実データと合成データを使用して学習した顔認識モデルのパフォーマンスの差を定量化することで、顔認識における合成データの利用に関して、洞察を提供することを目指しています。また、研究コミュニティにとって容易に再現可能な標準ベンチマークを提案しています。

データセット

FRCSyn Challengeでは、参加者に対して、FRCSyn Challengeに必要なデータセットをダウンロードできるようにしています。なお、これらのデータセットの再配布は、所有者から許可を得ています。

合成データセットとしては、「DCFace」と「GANDiffFace」が提供されています。下図は、DCFaceとGANDiffFaceで生成された合成データのサンプルです。FRCSyn Challengeでは、これらの合成データは顔認識モデルの学習時でのみ使用され、現実的な運用シナリオを想定したものになっています。

また、実データの学習データとしては「CASIAWebFace」「FFHQ」が提供されています。これらのデータセットは、それぞれDCFaceとGANDiffFaceの生成フレームワークの学習に使用されているものです。このため、実データのみを使用して顔認識モデルを学習する従来のアプローチと、合成データを使用して顔認識モデルを学習する新しいアプローチを直接比較することが可能になります。

顔認識モデルの評価のためには、4つの実データ「BUPT-BalancedFace」「AgeDB」「CFP-FP 」「ROF」を使用しています。BUPT-BalancedFaceは、異なる民族グループ間でのパフォーマンスのバイアスに対処するために設計されています。これは、FairFace分類器に従って、民族性と性別のラベルが再付けされています。ここでは、4つの民族グループ（アジア人、黒人、インド人、白人）と2つの性別（女性と男性）から成る8つの人口統計グループが考慮されています。AgeDBは、年齢の変動に関連したデータセットであり、CFP-FPは、顔の向きの変動を考慮したデータセットです。また、ROFは、遮蔽を考慮したデータセットです。

これらのデータセットは、顔認識モデルのベンチマークとして広く使用されています。異なる実データを学習と評価に使用することで、提案された顔認識モデルの一般化能力を分析することも組み込まれています。

FRCSyn Challenge

FRCSyn Challengeは、科学的な競争やベンチマークを実施するためのオープンソースフレームワークであるCodalabで開催されています。このChallengeは、合成データを顔認識モデルの学習に応用することを目指しており、特に現在の顔認識技術における2つの重要な課題である「人種バイアスの軽減」「年齢、顔の向きの変化、遮蔽、様々な人種を含む困難な条件下での全体的な性能向上に焦点を当てています。

これらの観点で性能を評価するため、FRCSyn Challengeは2つのタスクを検討しており、さらに、各タスクは2つのサブタスクで構成されています。サブタスクでは、顔認識モデルの学習データに焦点を当てています。1つは「合成データのみ」を使用するもの、もう1つは「実データと合成データを組み合わせた」ものです。各サブタスクの概要は下表のようになっています。

評価指標では、実データと合成データのギャップ（GAP）を評価するために、実際（REAL）と合成（SYN）の検証精度の差に基づいて、GAP = (REAL - SYN) / SYN を算出しています。また、タスク1では、人種間での検証精度の平均（AVG）と標準偏差（SD）のトレードオフ（TO = AVG - SD）を定義し、評価しています。

結果

下表は、FRCSyn Challengeでのタスクごとのランキングです。人種バイアスの軽減に焦点を当てているタスク1（サブタスク1.1と1.2）は、TO（トレードオフ）の降順に近く、SDの昇順、つまり、バイアスの少ない顔認識モデルから多いモデルへと並んでいます。特に、サブタスク1.1では、トップ2のチームは、GAP値がそれぞれ-0.74％と-3.80％を示しており、この結果は、DCFaceとGANDiffFaceの合成データが、現在の顔認識技術のバイアスを軽減する可能性があることを示しています。

また、学習データに実データを含めているサブタスク1.2では、AVGの増加に伴い、SDが減少傾向にあります。さらに、サブタスク1.1で見られるように、サブタスク1.2で、トップチームはGAP値が負になっており、合成データと実データの組み合わせ（提案されたモデル）が、実データのみで学習した顔認識モデルを上回ることを示しています。

タスク2に関しては、サブタスク2.1と2.2のデータセット全体の平均精度が、サブタスク1.1と1.2でBUPT-BalancedFaceに達成された精度よりも低いことがわかります。また、サブタスク2.1では合成データのみでの学習が良い性能を示していますが、トップ5チームのGAP値は正であり、合成データだけでは実データを完全に置き換えることは難しいことを示しています。しかし、サブタスク2.2のトップ2チームはGAP値が負になっており、合成データと実データの組み合わせることで、既存の制限を軽減できることを示しています。

まとめ

FRCSyn Challengeは、合成データを顔認識技術にどのように応用できるかを探る取り組みです。この分野では現在いくつかの問題があり、このチャレンジはそれらの問題に対処するためのさまざまな方法を分析しています。このチャレンジには、多くの研究グループが参加し、それぞれ異なるアプローチを提案しています。これらのアプローチは、いくつかの小さな課題（サブタスク）を通じて比較されています。

今後の研究で、これらの結果をさらに詳細に分析することで、合成データを使用した高性能な顔認識技術に関する示唆を提供してくれることが期待されます。FRCSyn ChallengeはCodaLabプラットフォームを使って、継続的にコンペティションを運営することを検討しており、これにより、新しいタスクやサブタスクが追加され、チャレンジがさらに発展する可能性があります。

この記事に関するカテゴリー

Takumu: インターネット広告企業（DSP、DMP etc）や機械学習スタートアップで、プロジェクトマネージャー/プロダクトマネージャー、リサーチャーとして働き、現在はIT企業で新規事業のプロダクトマネージャーをしています。データや機械学習を活用したサービス企画や、機械学習・数学関連のセミナー講師なども行っています。