これまでの研究においても、入力画像からVolumetricな表現(3D表現)の復元を行う試みは多く取り組まれてきました。しかし、Volumetricな表現では解像度の3乗に比例したメモリ容量が必要になるため、”高解像度での人物復元”は難しいとされてきました。その解像度問題を解決するために「PIFu: Pixel-Aligned Implicit Function for High-Resolution Clothed Human Digitization」という、新たな表現方法が提案されています。
PIFuを用いて三次元形状を得る具体的な処理についてですが、まず入力画像から、画像エンコーダを用いて画像に対応した特徴量(Fv)を抽出します。そして、次に三次元空間上の各点(x, y, z)と得られた特徴量から、その点が三次元の人物の内部なのか外部なのかを多層パーセプトロンを用いて判別していきます。この処理を三次元空間上の全ての点に対して行うことにより、空間のどこが人物の内部なのか外部なのかを求めることができ、Marching Cube法を用いることによって三次元形状の復元ができます。