網羅的サーベイから見るAI論文とは Part3

インタビュー 2020年08月11日

前月行われましたCVPR2020の論文に対して、cvpaper.challengeは実際に1047/1467本の論文をサーベイしました！その中からトップクラスの論文読破数を叩き出した上位一部の方にインタビューをさせていただきました。第四弾となります今回はこの方にインタビューさせていただきました。

名前：千葉直也
経歴：早稲田大学基幹理工学部表現工学科尾形研究室次席研究員 / オムロンサイニックエックス株式会社プロジェクトリサーチャー
専門：3次元計測(物の奥行き計測)、3次元データと点群深層学習
論文読破数：42本

CVPR2020注目論文
1.BSP-Net: Generating Compact Meshes via Binary Space Partitioning

注目論文1

Q1.リサーチのコツは？

コンスタントにやることですかね。

ー論文を読む時は何から始めますか？

知っている分野での読み方にはなってしまいますが以下のような流れですね。

何かしらのキーワード，著者，引用情報などで論文をピックアップします。
abstractを読みます。
図を一通り見ます(特にFigure.1)
introductionを読む。特に後半のcontributionが重要。ここまでで興味があれば次へ
methodsを見ます。ここまででさらに読み進めると
ablation studyでどのように評価したかを確認する。

conclusionはabstractやintroductionを読んでいるので読んだとしても冗長気味であることと「新しい問題設定やアイデアを思いつきました」って論文が多いのでconclusionにはその問題設定やアイデアがよかったと言うことが多いので読むことは少ないですね。また、resultsに関してはAI論文は基本的にどの論文も自分が一番または精度向上であることが書いてあるのが普通なので基本的には読むことは少ないですね。

Q2.サーベイしながらの生活はどのようなものになるんですか？

チーム内にかなり読まれている方がいたので引っ張られる形で最初の時は論文を読むペースが上がっていました。大体理想で1日4本を目安に指定していました。しかし、現実1日2~3本でしたね。

ー読む時間は固定してたりしたんですか？

どうしてもミーティングなどがあり、固定した時間ではやれなかったですね。なので、開いた時間や実験中のモデルの学習時間にサーベイを行っていましたね。基本的にサーベイは時間に囚われないので自由に行っていましたね。ただ学生時代は時間があるので学生時代は決まった時間にやっていました。

ー確かにモデルの学習時間にサーベイするのはちょうどいいですね。

Q3.論文リサーチをなぜ行うのか？

CVPRに限らず、arXivや別のカンファレンスは追うようにしています。経験的にarXivやトップカンファレンスで話題になったものはその次の年にその技術の派生や進展があります。そう言ったものに出会うためにもある程度論文に目を通しておかないと到底ついていくことができないためです。また、自分のキャラ付けにもなると思っています。AIは多岐に分野が渡っているため、幅広く捉えづらいです。そんな中私で言えば、3次元点群に詳しいと言う位置付けというかキャラ付けは自分にとっても価値のあるものだと思います。

ー面白い考えですね。確かに、AIって調べるとキリがないですが、その分野の物知りに聞くのが一番早いですよね。

Q4.どんな学会をリサーチ対象にしていますか？

論文投稿として気にしているのはこのような学会です。

ICCV
ECCV
CVPR
ICRA
IROS
RSS

上記以外では私はロボット系が多いですね。

Q5.個人的なCVPRの気になる点や流行はありましたか？

今年はImplicit surface形状表現系が気になりましたね。CVPR2019に同じような以下の論文が同時に採択されていました。

DeepSDF: Learning Continuous Signed Distance Functions for Shape Representation
Occupancy Networks: Learning 3D Reconstruction in Function Space
Learning Implicit Fields for Generative Shape Modeling

3本とも同じように面白いアプローチでした。また、PIFu(人の体の形と衣装を同時に推定)がICCV2019にも出ていました。これらが2019の流行の1つになる可能性がありました。そして、CVPR2020には予想通り、これらImplicit surface系を「学習しやすくしました」・「精度を向上させました」って論文が増えていました。

また、3次元も多いですね。というか当たり前になるんだなと感じました。

ーQ.3でもお答えしているように実際に昨年度から流行やトレンドの1つになって、今年の学会で多く出てきている1つの例がImplicit surfaceだったんですね。CVPR2019にしっかり流行を掴んでいれば、このあたりを研究することでCVPR2020には採択されやすかったかもしれませんね。

ーまた、他のインタビューに答えた方も言っていた通りで今回のCVPR2020は3次元が当たり前の時代になってきたんですね。

ただ、3次元が当たり前では切り口が甘いのではないかと感じました。私自身もここに答えを持っているわけではありませんが、3次元が当たり前なので3次元って言っても意味がなくて、例えば、点群のための・Implicit surfaceのための3次元という見せ方的な切り方と実社会のアプリケーションへの設定では3次元でなくてはいけないので3次元という切り口とセンサーから取得される情報が3次元なので3次元やセンサーの処理的に3次元が好ましいという切り口などのいくつか切り方はあると思います。とりあえず、流行として2次元→3次元では今後は切り方として弱いのかなと。流行に3次元がなってるからこそ3次元に帰着させるのではなく、他の切り口的に3次元が好ましくなっているように感じますね。

なので今後研究テーマを決めようと思っている学生は、3次元をやりたいって考えるよりは3次元が流行っているのは念頭に置きつつ、どう言った切り口で3次元を使うかを考えてテーマ設定すれば良いものになるのではないですかね。

Q6.学会のオンライン開催についてどう感じますか？

基本的にデメリットが多い印象ですね。

メリット

家で参加できるの楽ですよね。
発表の合間に作業をすることができる。

デメリット

リアルに会えない。
海外に行けないのは悲しい。(特に学生にとっては海外に行ける貴重な経験だと思う)

コロナの影響で仕方ない部分はあるものの、仮にコロナ関係なくオンライン化の波がきたときを考えても、現状ある学会はやはりオフラインでの開催もしてほしいですね。ただ、今回は全くの予想外からこういった開催をせざる終えなかっただけだとも思います。例えば、多くの方が「リアルに会えない」・「ポスター発表が寂しい」と言ったデメリットを多く感じると思います。こういった感覚っていくらオンラインMTGを繋いでも空間が途切れているので限界があるんですよ。しかし、そのデメリットをなくすような技術も出てきてはいるんですよね。

例えば単純に繋ぐのではなく、こういったバーチャル空間を使うことでこう言ったデメリットは改善できると思うんですよ。もしかするとこういった技術を使うことでオンライン開催も可能なのではないかと思います。このあたりの技術のアカデミアでの活用について，個人的には期待しています。

(出典：Virtual Conference 2019 (第１回大会))

ー今回は仕方なく準備できず、オンラインに強行した形ですが、確かにしっかり準備ができていれば、オンライン開催もいろいろできましたよね。これって各個人の準備は大変にはならないんですか？

HMDがあればいいですが、最悪はデスクトップだけでも参加はできます。個人の準備よりは運営側の負担のがかなり大きいですね。

Q7.AIに期待していることは？

ロボットに触れたいですね。Visionって最終的にはアプリやロボットに応用される分野だと思うんですが、vision系の方はセンサー系には強くて、ロボットには強い方は少ない印象です。今後もっと実社会のvision系が見たいですね。

今回のようなコロナの影響でもっと人が動かなくなることが多くなってロボットが動く時代や動かした企業やチームの価値も出てくると思うので、そう言った世界がもっと盛り上がってくるといいですよね。

Q8.AIの課題に感じることは？

どうやって現実社会に融合させていくかですね。少しvision系でセンサー優位な技術もあると思うんですが、そう言った技術を実世界に統合させたらどうなるのかも気になりますし、逆にできていないことが課題ですね。

ー皆さん似た課題感があるんですね。やはりロボットって夢がありますね。

Q9.どうすればAIがもっと流行ると思いますか？

AIって名前を使うこと自体が適していないのかもしれないのではないかと感じます。

これはどっかの受け売りな気もするんですが、日本人ってかわいいものって受け入れやすいと思うんですよ。技術説明が明確にできない、定義しきれない、研究者自体も結果に頭を抱えることができてしまう技術は一般の方からしたら得体のしれない物なんですよ。例えば、ロボットを売る時にAIが入ったロボットよりドラえもんとして売り出せば得体のしれない感は払拭されると思うんですよ。

ー日常に入っているので当たり前になった名前ってありますよね。ペッパー君とかアレクサみたいにあれらに恐怖することって少ないですよね。中には高度な技術が入っているが消費者からするとAIが入っているってさほど気にする物でもないですよね。確かにAIロボットよりドラえもんの方が買いたくなりますね。

ドラえもんはなんでもできる汎用型のロボットって普通に考えたら本当に怖いと思うんですよ。倫理観とかもあるし、でもあれが作品中で凄いことができるくせにこけたりするんですよ。それも怖いものではなく、かわいいものとしての印象づけに効果があるのかもしれないですね。無理にAIって言葉を使わなくてもいいんじゃないかなと思いますね。

CVPR2020summary結果はこちらからどうぞ