最新AI論文をキャッチアップ

子供の保護に向けた顔認証技術を目指す、新しい大規模データセット「YLFW」

子供の保護に向けた顔認証技術を目指す、新しい大規模データセット「YLFW」

Face Recognition

3つの要点
✔️ 子供の顔認識の精度向上を目指した新たなデータセットとベンチマークを提供した。
✔️ 新しいデータセットとベンチマークによって既存の顔認識アルゴリズムを評価し、その限界が明らかにした。
✔️ 新しいデータセットとベンチマークによって顔認識アルゴリズムを学習・評価し、性能が向上した。

Young Labeled Faces in the Wild (YLFW): A Dataset for Children Faces Recognition
written by Iurii MedvedevFarhad ShadmandNuno Gonçalves
(Submitted on 13 Jan 2023)
Subjects: Computer Vision and Pattern Recognition (cs.CV)
Comments: Published on arxiv.

code:  

本記事で使用している画像は論文中のもの、紹介スライドのもの、またはそれを参考に作成したものを使用しております。  

概要

過去10年の間にディープラーニングの発展とともに、顔認証は高精度になり、犯罪捜査や入国管理、銀行口座開設など、様々な場面で利用されるようになりました。しかしながら、依然として多くの課題があります。例えば、双子の識別や、年齢/性別/人種のバイアスなどがあります。特に重要とされているのが子供の顔認識です。

行方不明または誘拐された子供を見つけ、守るために喫緊の課題とされています。例えば、多くの国の年次報告書では、大量の行方不明児が報告されています。英国警察は2020年から2021年にかけて5万人の行方不明者を記録しました。アメリカでは、2021年に約34万人の子供が行方不明と報告されました。同年、カナダ政府は約2.8万人の子供が行方不明と報告しました。日本も例外ではありません。警察庁によると、海外に比べると少ないものの毎年約1,000人の子供(9歳以下)が行方不明者になっています。さらに、日本には特殊な事情もあり、夫婦の不仲によって同意のない子供の連れ去りが社会問題となっており、子供が連れ去られたまま、行方不明者になるケースもあります。国際結婚の場合には、海外に連れ去られてしまい、二度と見つからないケースもあります。正確な統計がないものの、相当数の行方不明者がいるとされています。

顔認証技術はこのような行方不明者となった子供を見つけ、守るために非常に重要な技術です。例えば、中国では、誘拐された息子を探し続けて三十年以上が経過した家族が、顔認証技術で息子と見つけ、再会することができました。警察が、子供の頃の顔写真から成人になった場合の顔写真を合成し、それをデータベースで識別することで見つけ出しました(誘拐された子どもが32年ぶりに両親と再開、顔認識技術が一助, CNN)。

また、UNICEFによれば、2021年に129カ国で約440万人の子供が暴力を経験しました(そのうち230万人について性別別データが利用可能であり、その53%が女性)。この数値は2017年に比べて80%増加しています。さらに、より急を要する問題は、子供が犯罪活動に関与することであり、それは被害者としてだけでなく、加害者としてもです。例えば、子供がドラッグやドラッグ取引に関与しているという証拠は世界中にあります。ここでも顔認証技術は重要な技術です。例えば、ブエノスアイレス市政府が展開している顔認識システムは登録された子供の身元情報を利用しています。顔認識技術を使って街を監視し、特定の個人を追跡するためのシステムを運用しています。

このように子供の顔認証は子供の人権と権利を守るために、世界的に重要な技術と考えられています。しかしながら、これまで顔認証のモデル構築のために利用されてきた顔データセットは成人に偏っており、顔つきが幼く、経年変化による顔の変化が大きい子供の顔認証では精度が低くなる傾向がありました。これまで、データセットが全くなかったわけではありませんが、その多くが非公開(Private)であり、また、規模が小さく、標準的なデータセットはまだありません。下表がこれまで報告されている子供の顔データセットの一覧です。


そこで、今回紹介する論文では、子供の顔認識のための基準となるデータセット「YLFW」を提供しています。「YLFW」は子供の顔認識のための最初の標準データセットであり、子供の顔認識モデル開発用の最大規模のデータセットです。このデータセットは、LFW、CALFW、CPLFW、XQLFW、AgeDBといった有名な顔データセットと同様の方法で作成されています。子供の顔画像に対する顔認識モデルを調整するための学習用とテスト用のデータセットも提供しています。

YLFWデータセットの概要

YLFWは「YLFW-Benchmark」と「YLFW-Dev」の2つのセットで構成されています。まず「YLFW-Benchmark」は、子供の顔認識アルゴリズムの性能を評価するためのデータセットであり、約10,000枚の画像と約3,000人のID(個々の顔の主体)から構成されています。このデータセットでは、1つのクエリ画像が1つのギャラリー画像と比較される検証プロトコルを採用しています。このプロトコルでは、約3,000組のマッチングペア(同一人物の異なる画像)と約3,000組のノンマッチングペア(異なる人物の画像)が用意されています。

次に「YLFW-Dev」についてです。これは子供の顔に適応した顔認識モデルを構築するためのデータセットで、2つのセット「YLFW-Dev-Train」と「YLFW-Dev-Test」に分けられています。YLFW-Dev-Trainは、約75,000枚の画像と約2,000人のIDを持つ学習用のデータセットです。一方、YLFW-Dev-Testは、約1,900枚の画像と約1,000人のIDを持つテスト用のデータセットです。YLFW-Dev-TrainとYLFW-Dev-Testでは、それぞれIDが重複しないように設計されています。つまり、学習用のデータセットで使用されるIDは、テスト用のデータセットには含まれていません。また、YLFW-Dev-Testは、YLFW-Dev-Trainが学習データセットとして使用された場合にベンチマークテスト(性能評価)を行うために使用されます。

さらに、データセットに含まれる人種ごとのバランスを取るために、YLFW-Dev-Train-Balancedというデータセットも用意されています。これは、YLFW-Dev-Trainの元のデータに対して、少数の人種の画像をランダムに追加することで作成されています。追加する画像は、水平フリップ(画像を左右反転させる)、明るさとコントラストの調整、画像の回転、ノイズの注入などの方法で拡張されています。下表が作成されたデータセットの概要です。

YLFW-Benchmarkによる性能評価

YLFW-Benchmarkを用いて、最先端(state-of-the-art, SOTA)の顔認識モデルが子供の顔認識において、どの程度の性能を示すかを評価しています。ここでは、最先端(state-of-the-art, SOTA)の顔認識モデルとして、MS1MV2データセットで学習したResNet-50の顔認識モデルを使用しています。ArcFace、MagFace、AdaFaceを適用する場合を実験しています。結果は下図と下表の通りです。なお、人種を次のように略記しています。Afr. - African, As. - Asian, Cau. - Caucasian, Ind. - Indian。


YLFW-Benchmarkの結果を見てみると、CALFWやCPLFWと同程度の難易度のベンチマークであるとわかります。また、YLFW-Dev-Testの結果を見てみると、FMRが高い場合、つまり誤って顔認識が行われる確率が高い場合には、YLFW-Benchmarkと同程度の難易度があることがわかりますが、FMRが低い場合、この難易度がやや下がることがわかります。

YLFW-Devを用いた性能評価

ここではYLFW-Devを用いた実験について説明しています。YLFW-Devは、学習データとテストデータの両方を提供することで、子供向けの顔認識モデルの開発を支援することを目的としています。 この実験でもResNet-50を用いており、損失関数はArcFaceを利用しています。下図と下表の結果から、学習データにYLFW-Dev-Train-Balancedデータを利用することで、性能が明らかに向上することがわかります。なお、下表は次のような略記を使用しています。CW - CASIA-Webface, VF2 - VGGFace2, MS1M - MS1MV2, YDTR- YLFW-Dev-Train-Balanced。


まとめ

この論文では、子供の顔認識に特化した新しい顔データセット「YLFW」を提案しています。このデータセットは、YLFW-BenchmarkとYLFW-Devの2つのパートで構成され、それぞれが若年層の顔認識研究の異なる側面に対応しています。このデータセットは初めての子供の顔認識に特化した標準化されたベンチマークであり、また最大のデータセットです。さらに、YLFWを用いた実験では、現在の顔認識が子供の顔に対して十分な性能に達していないことを示しました。また、このデータセットを使用することで、若年層の顔認識精度を向上させることが可能であることも示しました。

現在、ウクライナ戦争でも多くの親子が離れ離れになっていると言われています。今後、この研究をきっかけに、子供の保護に向けた顔認識の研究が進み、1日も早く、子供が巻き込まれる事件や犯罪の解決に顔認識/認証が役立つことが期待されます。

Takumu avatar
インターネット広告企業(DSP、DMP etc)や機械学習スタートアップで、プロジェクトマネージャー/プロダクトマネージャー、リサーチャーとして働き、現在はIT企業で新規事業のプロダクトマネージャーをしています。データや機械学習を活用したサービス企画や、機械学習・数学関連のセミナー講師なども行っています。

記事の内容等について改善箇所などございましたら、
お問い合わせフォームよりAI-SCHOLAR編集部の方にご連絡を頂けますと幸いです。
どうぞよろしくお願いします。

お問い合わせする