シミュレーターと現実の境界は埋められるか？

深層学習 2020年11月10日

3つの要点
✔️ シミュレーションと実世界のギャップを軽減する手法
✔️ シミュレータで学習させたモデルを直接実世界へ適用するのは困難
✔️ ImageNetの事前学習モデルの情報を保存することで汎化性能を向上

Automated Synthetic-to-Real Generalization
written by Wuyang Chen, Zhiding Yu, Zhangyang Wang, Anima Anandkumar
(Submitted on 14 Jul 2020)
Comments: Accepted at ICML2020
Subjects: Machine Learning (cs.LG); Computer Vision and Pattern Recognition (cs.CV); Robotics (cs.RO); Machine Learning (stat.ML)
Paper Official Code COMM Code

はじめに

実世界のデータを利用して教師あり学習を行うためには、大量のラベル付きデータが必要となる場合があります。例えば物体検出システムを作成するならば、大量の画像と、その中に含まれる物体についての情報を人間が付加したデータが必要となるでしょう。このように、実世界のデータに人手でアノテーションを行うには莫大なコストがかかってしまいます。

一方、シミュレーターを用いて自動的にラベル付きデータを作成すれば、こうした人手は不要となり、小さなコストで学習用データを用意することができます。そのため、シミュレーターを用いて作成した合成画像をもとにモデルを学習させ、それを実世界にも適用することができれば、アノテーションにかかるコストを大幅に削減することができます。

しかしながら、実世界とシミュレーションとでは当然、少なからず違いが存在します。そうしたドメインギャップに対処できなければ、前述の試みでは良い性能を発揮することはできません。

本記事で紹介するのは、こうした合成データから実データへの汎化性能を大幅に向上させる手法が提案された論文となります。