物体の本質を見抜け! 認知科学ベースによる物体の超二次関数モデリング !
突然ですが、質問です。
これは何ですか?
ほとんどの人は、これはコップです。と答えると思います。
それでは、この物体が立体的(3次元的)に”どんな形”をしているか考えてみましょう。
何が思い浮かぶでしょうか?(もちろんコップみたいな形!というのはなしで)
日常生活であまり考える機会もないので難しいとは思いますが、おそらく、円柱という言葉が思い浮かんだ人がいるのではないでしょうか。もしくは、液体を注ぐ円柱の部分と、取っ手の曲がった円柱の部分とに分けて考えた人もいると思います。
実はこのように3次元物体を基本的な形状に分解して扱うことは古くから行われており、認知科学者のIrving Biedermanはこの基本的な形状をGeonを呼び、RBC理論というものを提唱しました。
この理論では、人は3次元形状を基本的な形状の組み合わせとその配置から認識している(例えば、先ほどのコップが2つの円柱とその配置から認識されるように)のではないか。と言われています。
このように、今回紹介する論文は、深層学習を用いて3次元物体を複数の基本的な形状(直方体・円柱・球…)に分解するタスクを扱います。
つまり、入力は3次元物体(上段)であり、出力はその3次元物体を”表現するような”基本形状(下段)です。
例えば、左の飛行機を入力としたら、飛行機の胴体の部分や羽がそれぞれ基本形状で表現されます。
続きを読むには
(2441文字画像7枚)AI-SCHOLARに
登録いただく必要があります。
この記事に関するカテゴリー