網羅的サーベイから見るAI論文とは

インタビュー 2020年08月04日

cvpaper.challenge は CV (computer vision)分野のサーベイ・研究を実施する組織です。研究メンバーは新しいトレンドを創るべく研究活動を行っています。2020年の目標は「Google Scholar TOP20 にリストアップされている国際会議 / ジャーナルに30本以上投稿すること」です！現在までに研究員に限らずポスドク・学生を中心としたプロジェクトで CVPR/ICCV/ICRA などのトップカンファレンスに投稿し、査読を突破して来ました。

そんな活動の1つにCVPR2020網羅的サーベイなどのトップ会議のサーベイを通した研究のトレンドの把握を行います。
前月行われましたCVPR2020の論文に対して、cvpaper.challengeは実際に1047/1467本の論文をサーベイしました！その中からトップクラスの論文読破数を叩き出した上位一部の方にインタビューをさせていただきました。

CVPR2020summary結果はこちらからどうぞ

名前：QIU YUE (邱玥)
所属：筑波大学システム情報工学研究科、コンピュータサイエンス専攻D3, 筑波大学連携大学院，産業総合研究所　佐藤雄隆（指導教員）
専門：vision and language系 (EQA, イメージキャプショニング)
論文読破数：60本

CVPR2020注目論文
1.REVERIE: Remote Embodied Visual Referring Expression in Real Indoor Environments

2.Embodied Language Grounding With 3D Visual Feature Representations

Summary1 Summary2

Q1.リサーチしながらの生活はどんなものになるんですか？

私は比較的生活リズムを守って、論文のリサーチをしますね。朝から研究を始めて、論文リサーチは大体15:00~18:00くらいで行いますね。大体1本の論文をリサーチするのに0.5〜1時間かけます。なので、私の場合はある程度時刻に合わせてリサーチ時間を設けています。終わったら、研究や語学勉強をしたりします。

ー何かが終わった後とかではなく、午後のある一定時間をリサーチ時間として設けていたんですね。大切にしたのはその日の論文リサーチ数ではなく、1日コツコツ論文を読むと言ったサイクルを大切にしたんですね。

Q2.実際どんな風に論文を読むのでしょうか？

まず、対象となる論文から読みたい論文リストを作成します。今回は大体89本くらい選定しました。その選定基準はタイトルやabstrctからキーワードなどで選定します。その選定された論文リストから1日3~4本のペースで読んでいきます。

ー具体的にはabstractを読んでいきますよね？

大体はこんな感じですね。

abstractをまず読んでいきます。
introduction項の後半にあるcontributionを読みますね。
論文の後半のconclusionを読みます。
一通り図と表を見ます。
1と3に戻って復習をします。
introductionを全部読みます。
ここからは細かく見ませんが、手法とどんな評価をしたかを軽く確認します。自分の分野や興味を持ったら細かく見る場合もあります。

ーこれで大体0.5~1時間って感じなんですね。

Q3.論文リサーチをなぜ行うのか？

私の目的は2つあります。

1つ目は、CVPR・ICCV・ECCVは私の研究分野のトップカンファレンスです。そこには分野のトップが基本的には集まってきます。そこの論文をリサーチするとことで、分野の研究の流行など半年や1年くらいの全体像が見えてきます。また私のリサーチしてきた経験では、その分野の論文を読むことでアイデアと研究の行き詰まった時の解決策に出会えることがあるからです。

2つ目は、論文リサーチは1人でやろうと思うと大変です。しかしcvpaper.challengeで期限を決められて、皆でリサーチすることで必ずやらなければならないという思いから遂行することできますし、興味深いところは情報交換ができるためです。

ー実際にリサーチをしていることで見つけたアイデアで論文投稿した経験とかありますか？

今回のCVPRではないですが、ICCVの論文リサーチをしている時に、ある提案された手法が改善の余地があるのではないかというアイデアを実際に見つけました。そのアイデアを組み込むことでInternational Conference on Intelligent Robots and Systems (IROS)に論文投稿ができました。

ートップカンファレンス＝完璧ではなく、実際に読んでみると気づく発見見たいものがあるんですね。

Q4.個人的なCVPRの気になる点や流行はありましたか？

vision and language系には偏っているかもしれませんが、3点ほど気になることがありました。

1点目がタスクの難易度が高度になっていました。vision and language系で言えば、画像ではなく動画や2次元ではなく3次元になっていることが普通でした。前回のCVPRと比べれば、確実にタスクの難易度が上がっていましたね。画像からキャプションの生成だけではなく、画像内の言葉も認識しながら、キャプションするというタスクも上がってきていました。

2点目が精度だけではなく、解釈性や再現性などの重要ではあったが精度を求めるあまり無視されていた部分も注意が払われているように感じました。精度だけではなく、そう言った解釈性や再現性についても記載されている印象でした。定量的な結果だけではなく、定性的な結果もつけてくれている論文が増えていました。

ー精度の争いは少し落ち着きつつあるのかもしませんね。

3点目がEmbodied AIに関する論文が去年と比べても増えていませんでした。私的にはvision系＋ロボティックス＋language系は実用性が高く、タスクの提案やモデルの開発やデータセットなどが多く出てくると予想していたのですが、増えていませんでしたね。

ー逆にその部分はチャンスって感じですかね？

そうですね。ここはかなりやる余地がまだまだ残っていると思いますね。例えば、専門にもしているEQAが今年は1本も出ていませんでした。研究がなされていないか。採択されなかったか。同時に投稿されてしまってどちらも落とされたのか。理由は分かりませんが、今年0本だったのは気になりました。

Q5.どんな学会をリサーチ対象にしていますか？

全てを把握することは不可能なので、他の人のまとめでもいいので以下の学会は見ていますね。

CVPR
ICCV
ECCV
ICRA
IROS
ACL

Q6.学会のオンライン開催についてはどう感じますか？

メリット

旅費の削減できる
時間を省ける
オンラインなので参加しやすい

デメリット

直接著者に疑問点が聞けない
コミュニケーションが取れない
ポスター会場で人だかりができていればそれをみる気がなくても見る機会が得られていたがなくなってしまった

私個人は現地に行ってコミュニケーションがとりたいのでオフラインがいいと思いました。また、オンライン発表感覚的にはオンラインになっても意外と見にくる人は少ないなと別のオンラインでの発表時に感じました。

ー確かにオンラインの方が参加しやすいはずなのに、実際はそんなに見る人はいないというギャップは感じますね。もしかすると、現地にいくと見たいものの他にも学会に参加したので最大限色々見たいって考えがなくなって、見たいもの以外は見ない方もいるのではないでしょうかね。

私個人は現地に行ってコミュニケーションがとりたいのでオフラインがいいですね。私の感覚的にはオンラインになっても意外と見にくる人は少ないなと別のオンラインでの発表時に感じました。

Q7.日本と中国でAIで差を感じることはありますか？

明確には分かりませんが、国の政策は違う気がします。中国は国をあげて、資金も潤沢にAIに投資されている印象があります。メインの組織だけではなく、幅広く組織の端までAIのための資金が入っているように感じますね。

あと中国の大学に関していえば、入るのが難しい学部としてAIが挙がってきます。そのため、AI研究や大学で学ぶためにも物凄く競争が激しい印象があります。逆に日本では色々な人がAI研究やAIが学べる環境が整っていて凄いと思います。ここはかなり違うかもしれませんね。

日常生活でもまず実装してみるというのが中国は多いですね。なので、一般の人もAIが流行っている。AI技術が使われているという認識が多くの人にされていると思います。

ー中国社会全体がAIを認識しているって感じなんですね。

Q8.AIに期待していることは？

私の研究にも関わりますが、Embodied AIや家庭内ロボットなどの開発ですね。家庭内ロボットが一家に一台いるのは夢ですね。

ー逆に今のAIの課題はどんなところだと思いますか？

私的には、モデルの解釈性やブラックボックスは改善しなければいけないと考えています。ただ単に手法を出すだけでは、ブームも飽きられてしまいます。それに付随すると思うのですが、AIを狙った攻撃に対しても一部の研究者だけではなく、開発者全体が攻撃に対してどれくらい耐えられるのかですね。

Q9.AIがもっと流行るには？

難しいですね… 一回導入するっていうのもいいんじゃないですかね。例えばAIとはズレますが、電子マネーを考えてみると導入される前は”日本人は現金主義で、電子マネーは流行らない”と想定されていました。しかし実際に導入されてしまえば、意外と電子マネー使われていますよね。中国だと社会全体的に電子マネーを許容するようになって、今では電子マネー大国になりました。AIが社会に導入されて、成功体験ができれば流行るのではないかと思いますね。