網羅的サーベイから見るAI論文とは ラスト!!
前月行われましたCVPR2020の論文に対して、cvpaper.challengeは実際に1047/1467本の論文をサーベイしました!その中からトップクラスの論文読破数を叩き出した上位一部の方にインタビューをさせていただきました。第五弾であり、ラストはこの方にインタビューさせていただきました。
名前:相澤宏旭
経歴:岐阜大学 工学研究科 電子情報システム工学専攻 加藤研究室 D3
専門:画像生成 semantic segmentation 異常検知
論文読破数:33本CVPR2020注目論文
1.3D Photography Using Context-Aware Layered Depth Inpainting
2.Transferring Dense Pose to Proximal Animal Classes
Q1.リサーチのコツは?
特に気にかけていることはなくて、今回は時間があったので読めたって感じですね。ただ強いてあげるなら、毎日論文を読むことを習慣づけることですかね。また、報告するってことも気にかけてやっていましたね。
ー具体的にCVPRの論文をどのようにして選んで、どのような手順で読んでいますか?
- まず、タイトルから自分の興味のある論文を選定します。
- Abstractを読みます。
- Introduction項を全部読みます。
- Introduction項で読み取れなかったところを手法や実験項を読んで理解を深めます。
→論文まとめをつくる際は、ここで読む作業をストップします。もしその研究に興味があれば、関連研究など残りの項目までチェックします。 - 5. 今後自分の研究に活かせそうな論文であれば、どういう課題があるかをConclusionで解かれていない課題や、Resultでこの研究ができていないことを、見たりします。このとき、どのように問題を検証したかというプロセスも気にします。
ーこういう手順でリサーチを進めていってたんですね。単純に読むだけではなく、自分の研究に活かせないかも考えているんですね。
Q2.リサーチしながらの生活はどのようなものになるんですか?
論文は読みたくなったら、読むようにしています。
ー人によって論文サーベイを行うタイミングって大きく変わりますよね。
ただ、1日1本以上は読むようにして、目標は3本を目安に論文まとめを作るように意識しています。
ー論文1本あたりどれくらい時間をかけているんですか?
自分がよく知っている分野であれば、30分から1時間程度でまとめを作成しています。やっぱり疎い分野だと調べながら読み進めるので、1時間以上かかりますね。
Q3.CVPRの論文リサーチをなぜ行うのか?
確かに、CVPR、ICCV、ECCVは研究する上で外せない会議であって明確な理由はないですね。
ー名前が出ると言うことは何かあるってことですよね。これらの学会には、
そうですね。捻り出すと当たり前ですが、査読がちゃんとなされているため、ある程度の論文の質が担保されていることですかね。そのため、論文を読んで学べるところがかなり多いです。また、自分の研究の位置づけを知るためにも外せませんね。
ーもう少し、CVPRについて聞きたいのですけれども、今回論文サーベイをしていて気づいたことや、これが流行っているなと思った研究はありましたか?
こちらを参照していただけるとわかりやすいと思います。
個人的に気になったのは、3Dですかね。あるいは画像生成に関しても、単純に綺麗な画像を生成するだけではなくて、3D的な観点からどのように画像を操作するかといった研究の方向性になっており、次の段階に進んでいるなと感じました。
ー他に気づいた点はありますか?
単純に精度が出せればいいという研究が減ってきている気がします。
ーそれはどういうところから感じましたか?
Introductionを読んでいて特に感じました。研究の立ち位置や見せ方がうまいなと思いました。Projectページの作り方やアピールの仕方、精度だけでなくて、見た目のインパクトも大事なんだなと思います。年々この傾向が強まっている印象を受けました。
Q4.他にどんな学会をリサーチ対象にしていますか?
コンピュータービジョンや深層学習の研究を行う上では、次の学会は外せませんね。
- NeurIPS
- AAAI
- ICLR
- ICML
Q5.どのように情報収集をしていますか?
一番は、arXivを見ることですかね。
ーそれはやっぱり早くて、量がたくさんあるからですか?
そうですね。他には、Twitterや研究室内の人や友人からslackを通して、情報を得ています。
ーAIと親和性が高いSNSはTwitterですかね。著者自身もTwitterに挙げたりしますもんね。
ー現在、相沢さんは研究者・開発者・エンジニアサイドで研究を行なっていらっしゃいますが、研究を行なっていないビジネスサイドの方達はどのようにAI論文と関わっていけばいいと思いますか?
やっぱり研究者以外の方が論文をキャッチアップするのは大変だと思います。それは、同じ研究室の学部生を見ていてもそう思います。なのでAI-SCHOLARやcvpaper.challengeのような日本語媒体の論文紹介記事や解説記事を読んで、とっかかりを作ってから勉強するのが一番良いと思います。
Q6.学会のオンライン開催についてどう感じますか?
メリット
- 移動時間が少ない。
- 研究室で座りながら参加できる。
- 語学的なレベルが低くても何度も見返すことで内容が理解できる。
デメリット
- 論文を読んだり、研究をしたりするためのモチベーションが上がらない。
- オンラインだと熱量をリアルに感じられない。
ー確かにそうですね。今回スライドがYouTubeで流れたりしていましたけど声のトーンが普段と違ったり著者もいて、発表のリアリティーがいまいち掴めなかったですよね。
Q7.AIに期待していることは?
なぜ人間は物や空間を認識したり、絵を書いたり、目的を達成するために動くことができるのかといった人間の知覚と認識の理解に私は非常に興味があります。AIに期待をしすぎかもしれませんが、そういった疑問をAIという側面から解き明かしてほしい、またその手がかりを見つけてほしいという期待があります。
ーいわゆるロマンみたいなものを感じていらっしゃるんですね。確かにCVPRはコンピュータービジョンと言う割には、人間自体への応用はしていませんよね。
Q8.AIの課題に感じることは?
学習するために大量のデータが必要であることが課題だと感じています。Few-Shot learningが画像認識や機械学習の分野でも取り組まれていますが、現状のデータ駆動型の考え方や方法論などはもっと議論されてほしいですし、なぜ人間は少量のデータから新たな概念を学習できるのかといったメカニズムは解明されて欲しいですね。また、モデルの解釈性の課題とも関連しますが、現状いくつかの研究では精度は確認されるが、なぜ改善した?部分が欠落しているものもあるのでそういった理論も一緒に解明されていくことが課題ですかね。
Q9.どうすればAIがもっと流行ると思いますか?
実世界の課題を、リスクやコストも考えつつ、解くことができる課題に落とし込む、問題の作り方が大事だと感じました。例えば、ICCVで、野生動物や自然環境を保護する目的としてCVを取り入れようというWorkshopがあるんですよ。まず、前提としてAIが社会にすぐ応用するのは難しいと思うんですよ。社会がそれをよしとしてくれないと言うか。プライバシーや失敗したときのリスクもありますし、ただ、人間ではなく野生動物から少しづつ応用できることもあると思うんですよ。例えば、検出に失敗しても、自然保護の大義名分がありますからね。最終的には野生動物を人間に置き換えて、管理できてしまうのではないか?、もしかするとそう言うことまで考えて問題を作ってGoogleも出資しているのかなって少し思ったりしますね。これは勝手なイメージです(笑)。
CVPR2020summary結果はこちらからどうぞ
この記事に関するカテゴリー