顔なりすまし防止の大規模データセット「CelebA-Spoof」
3つの要点
✔️ 43種類の豊富な属性情報を含む、顔なりすまし防止の大規模データセット「CelebA-Spoof」を提案
✔️ マルチタスクフレームワーク「AENet」を用いて、顔なりすまし防止のタスクにおいて、属性情報が及ぼす影響を検証
✔️ 包括的な評価をサポートするため、汎用性の高い3つのベンチマークを提案
CelebA-Spoof: Large-Scale Face Anti-Spoofing Dataset with Rich Annotations
written by Yuanhan Zhang, Zhenfei Yin, Yidong Li, Guojun Yin, Junjie Yan, Jing Shao, Ziwei Liu
(Submitted on 24 Jul 2020 (v1), last revised 1 Aug 2020 (this version, v3))
Comments: Accepted at ECCV2020
Subjects: Computer Vision and Pattern Recognition (cs.CV)
Paper Official Code COMM Code
概要
本人確認、決済などあらゆる場面で顔認識システムが普及しています。しかし、その一方でセキュリティと信頼性を懸念する声が多く聞かれます。顔認識をする対象の顔が「生きている本物(Live)」か「なりすまし(Spoof)」かを識別する「なりすまし防止(Anti-spoofing)」は特に重要です。誰かがあなたの顔を偽造して、なりすまし、身に覚えのない本人確認や決済をされてしまうのは非常に危険です。このような事態を防ぐために、顔なりすまし防止は、他人による悪用からプライバシーと財産を守る重要な技術です。
これまでも中国を中心に多くの研究成果が報告されていましたが、複雑な顔なりすましの手法に対処し、実運用するにはまださまざまな問題が残っています。主な理由は、これまでの顔なりすまし防止のデータセットではデータの多様性と量の両面で不足していることです。特に以下のような問題があります。
1) データセットの多様性の欠如
既存のデータセットでは、被写体、セッション、センサーの種類が不足しています。ほとんどのデータセットが、被写体が2,000人未満、セッションが5以下、入力センサーが10種類以下となっています。
2) データセットのアノテーションの欠如
既存のデータセットでは、顔なりすましの手法のみをアノテーションしています。顔なりすまし防止の分野のデータセットとしては基本的なことですが十分とは言えません。顔のなりすまし防止のでは、豊富なアノテーション情報を持つデータセットはありません。
3) パフォーマンスの飽和
既存のデータセットを使用した識別精度はすでに飽和しています。今まで以上の認識精度や一般化能力を持つアルゴリズムを評価することが難しくなっています。例えば、SiWとOulu-NPUを使用してVanilla ResNet-18を評価した場合、FPR=0.5%でのRecallは、既に100.0%および99.0%に達しています。しかし、これらのデータセットで十分な精度だからといって、実用上は十分な性能なわけではありません。
このような問題を解消するために、この論文では、顔なりすまし防止のタスク向けに新たな大規模データセット「CelebA-Spoof」を構築しています。CelebA-Spoofには以下の特徴があります。
1) データセットの多様性
既存のデータセットでは、被写体、セッション、センサーの種類が不足しています。ほとんどのデータセットが、被写体が2,000人未満、セッションが5以下、入力センサーが10種類以下となっています。
2) 豊富なアノテーションの欠如
CelebAで定義された40種類の顔属性に加えて、顔なりすましの種類、照明条件、撮影場所の3つの属性を加えた43の意味情報でアノテーションされています。豊富なアノテーションによって、包括的に顔なりすまし防止の検証ができます。
3) 最大規模のデータ量
10,177人の被写体による625,537枚の画像で構成されています。顔なりすまし防止向けのデータセットで最大の規模です。
また、この論文では、マルチタスクフレームワークである「AENet」を用いて、顔なりすまし防止におけるアノテーション情報の影響を検証、ベンチマークも提供しています。
続きを読むには
(8592文字画像16枚)AI-SCHOLARに
登録いただく必要があります。
この記事に関するカテゴリー