AI版ウォーリーを探せ!?どんな小さなヒントも見逃さない画像認識モデル !

防犯カメラやセンサー、顔認証システムなど、人物認証は現代ではなくてはならない技術の一つになりました。従来の人物認証問題に対して、多くのシステムでは”畳み込みニューラルネットワーク(CNN)”を用いていますが、この論文では人物の再識別問題に対して最適化されたモデルが提案されています。

参考論文 : Omni-Scale Feature Learning for Person Re-Identification

再識別問題 : re-identification problem(ReID)とその課題

これまでの画像認識技術では、男性の年齢や服の色、もしくはそれらの組み合わせを認識することで “特定人物の認識”を可能にしていました。しかし、より実用的なシチュエーションを考えた場合、例えば”夏に白いTシャツを着ている若い男性”はありふれており、それらをさらに詳しく認識する技術が必要になってきます。

こういった”似てるけど違う人物”を考慮したのが人物再識別問題です。人物を照合するため、一度個別のカメラに映った人物を、視点が重複しない別のカメラで認識します。

この技術は、例えばフェイスブックで採用されている自動タグ付け機能のように、一度手動でタグ付けした画像内の人物を別の写真でアップロードした時に自動で識別し再度タグ付けを行う機能で必要不可欠なものです。

一方、近年では、ResNetのようなCNNをベースとしたモデルが人物認識のために広く使用されてきました。しかし、CNNモデルは元々、画像の”分類”を目的として作製されたモデルであり、人物再識別問題に必要な”即座の人物識別”には最適化はされていませんでした。提案されたモデルでは、ResNetを最識別問題に最適化させ、より詳細なデータ(服のロゴや上半身の大きさ)なども考慮に入れることで、”オムニスケール(大局的と1特徴だけでではなく局所的特徴も考慮したもの)”の視点でのデータを統合し、人物の特定を行うことを実現しています。

この記事をシェアする