網羅的サーベイから見るAI論文とは Part4
前月行われましたCVPR2020の論文に対して、cvpaper.challengeは実際に1047/1467本の論文をサーベイしました!その中からトップクラスの論文読破数を叩き出した上位一部の方にインタビューをさせていただきました。第四弾となります今回はこの方にインタビューさせていただきました。
名前:綱島秀樹
経歴:
・早稲田大学大学院先進理工学研究科物理学及応用物理学専攻 森島繁生研究室 博士1年
・国立研究開発法人産業技術総合研究所 人工知能研究センターCV研究チームResearch Assistant
・cvpaper.challenge研究チーム幹部
・AI-SCHOLAR所属
専門:深層生成モデル
論文読破数:32本CVPR2020注目論文
1.Which Is Plagiarism: Fashion Image Retrieval Based on Regional Representation for Design Protection
Q1.リサーチのコツは?
読み方のテクニックももちろんですが、毎日読むことが一番のコツですね。ルーティーン化することを意識しています。
ー具体的に論文はどのようにして選んでいますか?(CVPRの場合)
- 投稿ジャンルで興味のあるものをピックアップします。(image and video synthesisなど)
- オーラルのタイトルはかならず目を通し、面白そうなものは全て読みます。
- ポスターはタイトルに目を通し、興味があるものはストックしておきます。
ー論文を読む手順はどのようにしていますか?
大体はこんな感じですね。
- まず、abstractを読んでいきます。
- Fig. 1がトップページにある場合は、まずそこを見ます。
- Introduction項を読んで、この論文でしたいことを大体把握します。
- 一通り図と表を全て見ます。
- 最後にConclusion項を読みます。
- IntroductionからConclusionまでの内容をつなぎ合わせてこの論文が意図する部分を理解する
- Methodsは、本文中の図に載っているもので理解できることが多いので目を通すことは少ないですが、あまりにも理解できないものは手法も読みますね。
ーCVPRに関して言うと。Figure.1が重要な役割を持っていそうですね。もっと一般の方向けに論文サーベイをするならどうすれば良いですか?
- 私は読む際にまず自分が読めるレベルであるか、読めそうなテーマであるかabstを読んでチェックします。
- 難しそうだなって論文はその時点で諦め、別の論文を選定するという方策をとった方がいいですね。
- 読む際に関しては、まずabst, introと読みます。
- そのあとは図と表とそれらのキャプションを一通り目を通します。
- この時点でまだ理解が自分の中で甘いようであれば4に戻って再度読みます。
- 概要部分をまとめて、この論文の貢献部分をintroと実験結果の図や表から読み取り、新規性を記述します。
- 最後に一番貢献している(効果がある)図を選定、タグ付け、何故通ったかや所見などを記述して、まとめます。
Q2.リサーチしながらの生活はどのようなものになるんですか?
睡眠時間が7時間として、17時間が活動時間となります。大体食事など諸々込みで3時間を取られたとすると、毎日約14時間を自由に使えます。私の場合は13時間を研究活動になるべく当てるようにしていて、この時間で研究する時間と論文をリサーチする時間に分けています。論文1本あたり1時間を読む時間として、研究と論文リサーチを交互に行なっています。1日3本ペースで論文を読んでいますので、少なくとも研究、サーベイ、研究、サーベイ、研究、サーベイ、研究のサンドイッチって言った感じでリサーチの時間をとっています。また、趣味でもありますが、気分がすっきりするのでメンタル管理として1日1時間くらいは筋トレをしています。筋肉量が他人より多ければ財産を人より保有している優越感に浸れます笑 (これが自己肯定感のメンタル管理という点で意外と効いてきます。研究がうまくいかなくても筋肉あるからいいか、という気持ちになるので研究を継続する支えになります)
ールーティン化ってお話があったのでこう言ったリズム的なルーティンがあるんですね。
Q3.論文リサーチをなぜ行うのか?
理由としては3つあります。
- 流行においていかれないようにするため
- 読書的な感覚で趣味になりつつある
- 論文のコレクションが自分の自信に繋がるため
3について言うと、Scrapbox(スクラップボックス)に私はまとめを作っていくんですが、それがたまっていくのを見ると優越感や自信に繋がりますね。ただ漠然と論文をインプットしていくよりも読む質も上がるし、モチベーションにも繋がりますね。
ー凄いですね。確かに自分専用のまとめが出来ていくのは、かなりモチベーションなどに繋がりそうですね。また、単純に読むだけではなく、まとめを作る(アウトプット)のもセットになっているのが尚、リサーチ力を高めていっているのかもしれませんね。
ーまた流行に遅れないというのは、非常に大事なことだと私も思います。では、論文リサーチしないと、やはり流行においていかれますか?
そうですね。おいていかれるのはもちろんです。最近は、別分野からの技術の輸入が多いので、別分野の論文にもある程度精通しておかないとその輸入ができない、または知らないと研究の新規性を見いだすことも非常に難しくなると思います。
ー確かにそれはよく感じますね。他分野でも全く違う分野からの輸入があるのが当たり前なのだから、AIって枠組みで見たら、AI内くらいは幅広く知っていった方がいいですよね。
Q4.どんな学会をリサーチ対象にしていますか?
論文投稿として気にしているのはこのような学会です。常時追っていくことが多いですね。
- ICCV
- ECCV
- ICLR
- CVPR
- ICML
- NeurIPS
- IJCAI
- AAAI
また、話題に上がったら読む学会やジャーナルは
- BMVC
- ICPR
- ICIP
- ACCV
ジャーナルってところでいくと
- patten recognition
- PAMI
ーなぜ以上のようなトップカンファレンスの記事をリサーチしていらっしゃるのですか?
やはり最低限の論文の質が担保されていることが一番の理由です。全てではないですが、比較的安心して読める。また、トップカンファレンスなので、インパクトの大きな研究が発表されているのでチェックすべきことが多いからですかね。
ーCVPRで発表された研究の中で,気になったものはありましたか?
私は生成モデルに関する論文を特に読んでいて、その中で気になったものはベストペーパーのような3DをSingle imageから作ることや一旦3Dを経由して2Dにもどすという内部でレンダリングを行うというものがあるんですけども、現実世界に用いるために3D的な事前知識を仮定することを多くの研究者が行なっているなと今年は色濃く感じました。あとは、生成タスク系は精度がサチって(限界に近づいている)きていて、細かい部分の生成に気にするものが増えていましたね。あとは生成をコントロールしようとする論文も増えてきていると思います。
また、Self-Supervised Learning(自己教師あり学習)はかなり使用が当たり前になりつつありますね。
Q5.どのように情報収集をしていますか?
毎日arXivのCS, CV分野に流れてくるものをみています。自分に関係する研究内容に関しては、Google scholarでアラートを入れるようにしています。またGoogle scholarで論文検索してCitationの多い論文から派生して論文を探しています。さらに友人関係やTwitterなどから誰かが読んだ論文を自分でも読んだりしています。基本的に取りこぼしがないような情報収集を心がけています。
ー現在綱島さんは開発者・エンジニアサイドで研究を行なっていらっしゃいますが、研究を行なっていないビジネスサイドの方達はどのように論文やトップカンファレンスと付き合って行けばいいと思いますか?
最新かつ有効な手法を知らないと他業種に負けるのは当たり前だと思います。そういった観点から言うと、ビジネスサイドの方が研究サイドよりもシビアだと思います。なので自分が関与している最先端の研究分野に関しては常にアンテナを張っていなければいけないと思います。
ー確かに研究界隈でAIが騒がれていても、生物や物理学や宇宙や素粒子って言った分野の方は分野ごとにやるべきことは大きく変わらないのに、ビジネスの方々は社会の流れに合わせていく必要があるのでそう言われるとシビアですよね。
ーまた私の経験ですが、アメリカの有名なあるボードを作っている企業の方と喋っている際にその時に少し前に行われたAI学会の技術の話も普通にしていて、よく知っていますねって驚いた記憶があります。
Q6.学会のオンライン開催についてどう感じますか?
基本的にデメリットが多い印象ですね。
メリット
- 地理的な障壁が下がる。
- 気になる研究をピンポイントで見ることができる。
デメリット
- ポスター発表のライブ感がない。
- 著名な研究者に会うのにオンラインは嫌じゃないか?
- 参加者同士の交流がない。
- 海外に行けない。
- 興味のある研究以外を目にする機会が減ってしまう。
- 時差のせいで開催時間に合わせるのが難しい。
- 参加者のリアクションが得られない。
ー地理的な障壁が小さくなることより、誰でも参加できるようになったのにも関わらず、実際多くの学会は参加者や発表者の数が減っていますよね。確かにデメリットを多く感じますね。
Q7.AIに期待していることは?
汎用型AIいわゆるシンギュラリティに常に期待をしています。ドラえもんの4次元ポケットのように非現実的と思われているレベルの汎用AIを作るのが可能だと思っています。
ー確かに汎用型AIを見てみたいですね。
人に役立つ科学というより、実現したら技術的に素晴らしいなというロマンを私は追究したいですね。
Q8.AIの課題に感じることは?
マルチモーダルをもっと統合するような話題が出てこないのが、まだまだ足りていない気がします。例えば現実世界でEmbodiedで、視覚・聴覚・触覚のようなタスクを統合したような、より実世界に寄せている話題が少ないと思います。本当に実世界に近づく研究がそろそろ出てくる頃ではないかと思いますね。もっと他分野が協力する時代が来てもいいのではと感じています。
ー確かに同じような課題を感じている方は多いですね。
こんなにAIが発展しているのに、あまりそのような研究が出てこないのが不思議ですね。NLP系の研究室やCV系の研究室ではなく、AI系の研究室(実世界により寄せた研究を行う研究室)がもっと出てきて欲しいですね。
Q9.どうすればAIがもっと流行ると思いますか?
ー中国やアメリカではAIがどんどん浸透してきている一方で、日本では全然流行っていませんよね。
そうですね。日本ではまだくすぶっている気がします。やはり国がAI導入を押していないのが大きな原因ではないでしょうか。アメリカや中国と違って、日本は国家的投資が圧倒的に少ないです。アメリカや中国の場合は国が導入を進めるから自然と実用化も進んでいると思います。
ー確かにそう言った違いがあるかもしれませんね。でも逆にそれが行われればさらに進むと言う期待も持てますね。
CVPR2020summary結果はこちらからどうぞ
この記事に関するカテゴリー