深層学習で人の動作を予測するAIが登場

本論文は、2018年1月にInternational Journal of Computer Visionという画像/動画認識をテーマにした論文雑誌で掲載されたものです。

動作を予測するAIとは?

今日ご紹介するテーマは「姿勢推定」という、人間の動作を認識、推定(予測)する技術についてです。人間の動作認識というとまず思い浮かぶのはモーションキャプチャーでしょうか。モーションキャプチャーとは、マーカーと呼ばれるポイントが無数にうたれたスーツを着て動きを撮影して認識するというもの。昨今この姿勢推定に画像/映像のディープラーニングを用いることで、マーカーをつけずに姿勢推定する研究が盛んです。今日ご紹介する論文はそんなディープラーニングによる姿勢推定を、劇的に高速に、より正確に行うアプローチを紹介する内容です。

上記のような人間が簡単に行っている視覚的な認識をシステム上に落とし込むには、非常に複雑な計算式と膨大な計算量が必要になります。そのため、計算中に起こるミスや計算量によるラグから正確な姿勢、次の動作を予測するシステムはまだ確立されていません。

今回の論文は画像の深層学習を用いて、次にどのような動作をするか予測をするものです。例えば上でも述べた、歩くや走るといった基本的な動作から、ピッチャーの投球フォーム、サッカーでボールを蹴るといったスポーツにおける動作まで、様々な予測を行うことが高速かつ高精度になれば、今後、主にスポーツ業界において重要な役割を担うと考えられます。

本論文の新規性は、単眼画像や2次元の関節位置ヒートマップから抽出したデータを深層学習させることで3次元化した点と、LSTM(Long Short Term Memory)を用いて次の行動を予測するアルゴリズムを組み合わせた点にあります。この方法により、行動予測の精度とスピードを高めることに成功しました。

この技術をさらに発展することが出来れば、例えば、お店の中に入った人の行動予測が取れたり、スポーツにおいてトップ選手の身体の使い方を知り、瞬時に予測をしてホームランが打てるようになるかもしれませんね。

今回の論文は、行動予測というテーマのものを取り上げてみました。深層学習を理解することで、人の動きを予測することが出来てしまうなんて、技術の発展に本当に驚いています。この技術はさらに、VRのようなゲームをよりリアルにすることなんかもできるようになるかもしれない!と、勝手に予測してみました(笑)

最後まで読んでいただき、ありがとうございます!

AIを活用した姿勢推定ソフトウェアを開発

AIが人間を監視する社会は迫っている

Isinsu Katircioglu et al.(2018).Learning Latent Representations of 3D Human Pose with Deep Neural Networks. International Journal of Computer Vision.

ライター:株式会社wevnal ChatbotAI事業部 木村駿