深層強化学習による滑らかで精密な人体3Dモデル再構成

人体の動きは、どこまで精密に再現できるでしょうか?人体の構造は非常に複雑で、筋肉だけでも600部位以上あるとされています。本稿では最近発表された、ソウル大学の研究による”人体構造のモデリングと深層強化学習を用いた制御システム”について紹介します。

参考論文 : 「Scalable Muscle-Actuated Human Simulation and Control

人体のメカニズムと3D再構成の難しさ

人体の動きは、非常に複雑なものです。

例えば、筋肉の収縮運動は、筋繊維の力学的な活動部分と非活動部分から発生します。人間は、このよう筋肉の状態や骨の構造などを相互に作用させながら、体を動かしています。さらに人の体は、関節と、600以上の筋肉から構成されており、疲れや癖、感情など、その動きは人によりもよっても異なります。 

本稿では、深層強化学習を用いて、骨格と筋肉を活性化し、典型的な動きから細やかな動きまでを3Dモデルによって再現することを提案しています。

3Dモデル再構成に当たっての技術的な課題として、正確かつ包括的な人体のモデリング、そしてその動きを制御するためのアルゴリズムの生成が難しいことでしょう。

過去の研究でも、深層強化学習を用いて歩く、走るなどの動作を再現することに成功していますが、これらの技術は、関節を実際に動かしているわけではなく、表面的に人体モデルを動かしているだけでした。また、これまでの研究ではモデルが学習できる筋肉はせいぜい18パーツ程度でした。実際の筋肉のように細かく、さらに関節を駆動させることにより人体を駆動させるモデルは未だ報告されていません。今回はこれを再現する3Dモデルを製作していきます。

滑らかで精密な人体3Dモデル

ここでは、筋肉の構造力学から得られる情報を基に、全身のモデルとその制御システムを作製し、実際の人体の動きを再現することを目的とします。人体の動きを再現するために、深層強化学習を用いて人体の特徴やその制御方法について再現可能かつ確かなシミュレーションを入念に行いました。このモデルを用いて、弱まった筋肉や、補装具をつけた部位など、身体的に負担のある人体の動きの予測も可能です。加えて、モデルの活用例として、外科手術の3 Dモデリングによるシュミレーションも行っています。

より詳細には、人体の動きを2段階層に分類し、それぞれに必要なアルゴリズムを搭載します。一つは、骨格の動き、もう一つは筋肉の動きです。この2段階層アルゴリズムにより、346個の筋肉による駆動を再現し、様々な動きを3Dモデルに行わせます。

モデル概要

作成したモデルは、上記のような図にまとめることができます。

大きくモデルを2段階に、”骨格”を動作させる(Trajectory Mimikingモデル)と”筋肉”を動作させるモデル(Muscle Coordination)に分けることで、従来のモデルを超える精密さと滑らかさで駆動する筋肉約300パーツを表現することを実現しています。

上記の3D人体モデルに”参考動作”を入力することで、参考の動きをさせることをゴールとします(学習には模倣学習を用いてます)。骨格と筋肉は動作を行うと、”参考の動き”と”現状のモデルの動き”の差を計算し、これが最小になるような骨格と筋肉の動きをそれぞれ探し続けます。この時、”参考の(体全体の)動き”は入力しますが、”正解である関節と筋肉の動き(正解データ)”は明示しません。理想的な体の動きを目指して、”骨格と筋肉の動き”を探し続けます。

具体的には、エージェントに、状態関数として”骨格の状態”、行動関数として “骨格のと関節の動作”を設定し、最終目標として”参考の動き”をインプットします。この時、参考の動きとモデルの動きの違いの少なさを”行動価値関数”とします。骨格を動作させるモデル(Trajectory Mimiking)によって、エージェントは報酬を最大化するまで骨格の軌道を模倣します。さらに、その出力に追加の入力データとして、”筋肉の状態”をインプットします。これらの情報を統合し、最後に体全体の動きを動作させるモデル(Muscle Coordination)によって再現します。

結果

以下は、今回作成されたモデルによる様々な人体の動きの再現です。3Dモデルには170cm 72kg(標準的体型)のモデルを使用しています。

歩く、走るといった基本的な動作から、ダンスやキックといった複雑な動きも非常に精密に再現していることがわかります。また、補装具をつけた動き(動画 3:27~)についてもうまくモデリングしています。また、従来の3Dモデルに比べて、深層学習を用いた関節駆動による動きは非常に滑らかかつ繊細に表現できていることがお判りいただけると思います。

まとめと今後の展望

しかし、本研究にはまだまだ改善の余地があります。まず一つに、モデルに解剖学や人体構造学などの専門的知識のインプットが必要なことです。これでは、汎用化されているとは言えず、前提知識を必要としないend-to-endモデルの作成は未だに課題です。また、本研究では、各パラメータも手入力で調整を必要とします。人体の動きを自動的に学習し、要求された運動を再現するには、モデルを改良する必要があります。

これら技術の応用として、様々な活用方法が考えられます。下図は、今回作成したモデルを用いて”足の手術”を再現したモデルです。手術前のモデルから、様々な角度で手術による矯正過程と手術後の体を3Dモデルで再現しています。実際に医療の現場では、手術候補が複数挙がることがありますが、このモデルを用いることにより術後の結果を推測することで、患者も安心して手術に望むことができるのではないでしょうか。