顔特徴量の関係性を規定しない新しい顔認識アルゴリズム「BioMetricNet」とは?
3つの要点
✔️ ユークリッド距離や角度距離など特徴量間の関係性を事前に定める必要がない新しいアルゴリズム「BioMetricNet」を提案
✔️ 代わりに、マッチングと非マッチングが事前に定められたそれぞれの分布に従うよう学習
✔️ 顔認識で高精度を達成している手法(CosFace、ArcFace、SphereFace)と比べて、一貫して高い精度を報告
The Effect of Wearing a Mask on Face Recognition Performance: an Exploratory Study
written by Arslan Ali, Matteo Testa, Tiziano Bianchi, Enrico Magli
(Submitted on 13 Aug 2020)
Comments: Accepted at ECCV2020
Subjects: Computer Vision and Pattern Recognition (cs.CV); Machine Learning (cs.LG)
顔認識アルゴリズムの歴史
ここ5年ほどの間、ディープラーニングはさまざまな分野で大きな成果を上げています。特に畳み込みニューラルネットワーク(CNN)は、画像認識の分野に大きく貢献してきました。今回ご紹介する顔認識もそのうちの一つです。
この顔認識においては、2014年/2015年には、Facebook等が報告したDeepFaceやDeepIDなどCNNで学習した特徴量を利用する手法で顔認識の精度が向上しました。これらのモデルでは、顔を識別するために、顔の特徴量間の識別に対してL2ノルムなどの距離を指標として採用しています。特徴量間の距離が閾値以下の場合、2つの顔は同一人物のものと分類され、そうでなければ別人のものと分類される仕組みです。
特徴量を計算するために、損失関数としてsoftmaxcross-entropyがよく使われています。クラス間の分散を最大化し、クラス内の分散を最小化することで、識別能力が向上することがわかっています。
その後、2015年にGoogleからFaceNetが報告されました。Triplet Lossという損失関数を導入することで、特徴量間の距離を絶対値ではなく、相対値で評価する方法です。このモデルでは、識別の基準となるAnchorを導入し、Anchorと類似度が高いPositiveに対して距離を最小化し、類似度が低いNegativeに対して距離を最大化するよう学習します。
しかし、効果的な学習が可能になる一方で、学習が複雑になる傾向があります。その後、L2ノルムなどの距離を使用したアルゴリズムではなく、角度を使用する新しいアルゴリズムが提案されました。
2017年頃には、Spherefaceというモデルが報告され、角度距離を用いてNegativeな特徴量間のマージンを大きく取ることで、False Positivesの数を減らす方法を提案しています。
ここまで挙げてきたアルゴリズムは、2つの特徴量間の関係性を空間上にマッピングするために事前に定義した指標(距離/角度)が用いられ、類似度が高い特徴量間の距離を最小化しながら,類似度が低い特徴量間の距離を最大化するように損失関数を設計し、学習させています。どの指標を選択するかは、モデルの設計において重要です。上記のモデルでは、ユークリッド距離よりも角度距離を使用する方が性能が大幅に向上することがわかっています。現在では、Arcface、Cosfaceというモデルが高い精度でよく知られています。
この論文では、これら従来と異なる方法を提案しています。上記のアルゴリズムのように特徴量間のマッピングの指標を事前に定義していません。この論文で事前に定義するのは、特徴量がマッチングペアか非マッチングペアかに応じて、モデルから出力される値をどのように振る舞わせるかということだけです。具体的には、モデルの出力値がマッチングペアと非マッチングペアで2つの異なる統計分布に従うように正規化します。つまり、識別能が高い特徴量を学習するだけでなく、類似度が高いマッチングペアがある分布にマッピングされ、類似度が低い非マッチングペアは別の分布にマッピングされるよう、マッピングの指標も同時に学習します。
今回提案する方法であるBioMetricNetでは、出力値の分布は分かっているので、モデルのFAR(False Acceptance Rate)やTAR(True Acceptance Rate)が理想的な状態になるように、閾値を簡単に調整できます。また、後述するように、非常に困難なデータセットに対しても、従来のモデルより高い精度を示しています。この論文ではBioMetricNetを顔認証に適用していますが、この方法は汎用的であり、他の生体認証情報やデータタイプにも適用できるとしています。
BioMetricNetとは
続きを読むには
(7282文字画像20枚)AI-SCHOLARに
登録いただく必要があります。
この記事に関するカテゴリー