世界屈指の顔認識技術を持つMegviiが研究する、データの不確実性に強い顔認識モデルとは?

世界屈指の顔認識技術を持つMegviiが研究する、データの不確実性に強い顔認識モデルとは?

3つの要点
✔️ 顔認識モデルでデータの不確実性をモデリング
✔️ 従来のPFEと異なり、
不確実性(σ, 分散)だけでなく、特徴データ(μ, 平均)も同時に学習が可能
✔️ 従来のPFEよりも不確実性に対して堅牢で高精度なモデルの構築が可能

Data Uncertainty Learning in Face Recognition
written by Jie Chang, Zhonghao Lan, Changmao Cheng, Yichen Wei
(Submitted on 25 Mar 2020)

Comments: Accepted as poster by CVPR2020
Subjects: Computer Vision and Pattern Recognition (cs.CV)

概要

ディープラーニングによる予測結果は必ずしも確実なものではありません。予測の不確実性が高く、信用できない場合、そのモデルの予測結果を利用するにはよく検討する必要があります。

特に自動運転や医療診断、資産運用など命やお金に関わるシステムにディープラーニングモデルを適量する場合には注意が必要です。不確実性が高い場合は、モデルの見直しや人によるオペレーションを追加するなど検討が必要です。

そこで、不確実性を高める要因をモデル化することで、致命的なトラブルが発生する可能性を低減する研究がなされています。この不確実性には主に2つあります。

  • モデルの不確実性
  • データの不確実性

1つ目の「モデルの不確実性」とは、学習データに含まれていなかったデータに対してモデルの予測が不安定になることで生じるものです。こちらは学習データが増えることで低減することができます。

2つ目の「データの不確実性」とは、データ取得環境などによるデータ固有のノイズによって生じるものです。こちらは複雑でノイズの原因を特定することが難しいため、学習データを増やしても低減することが難しいとされています。顔画像では、下図の赤枠内のように、ブレたり、一部が隠れている画像などが考えられます。


図1. 顔データに見られるノイズ(MS-Celeb-1Mの場合)

この不確実性は、近年注目され、広く研究されている分野ですが、顔認識の技術分野では、あまり研究されてきませんでした。この論文では、データ不確実性のモデル化を顔認識モデルに適用する方法を提案・検証しています。

この記事をシェアする