強化学習において実はAugmentationが有効?
3つの要点
✔️ DeepMind ControlとOpenAI GymでState-of-the-Artの結果
✔️ Augmentationによりテスト時の汎用性が向上
✔️ 新たなAugmentation手法を提案
Reinforcement Learning with Augmented Data
written by Michael Laskin, Kimin Lee, Adam Stooke, Lerrel Pinto, Pieter Abbeel, Aravind Srinivas
(Submitted on 30 April 2020)
Comments: First two authors contributed equally, website: this https URL code: this https URL and this https URL
Subjects: Machine Learning (cs.LG), Machine Learning (stat.ML)
はじめに
画像を入力とした強化学習は、データ効率が悪い、汎用性が低いなど様々な問題があります。本記事では、Reinforcement Learning with Augmented Data (RAD)とよばれる、入力の画像に対してaugmentationを行うことで、学習効率を上げた論文を紹介します。Augmentationはコンピュータービジョンの分野ではよく使われており、手法はとてもシンプルですが、従来利用されていなかった画像のaugmentationが有効だということが分かり、多くのRLアルゴリズムの学習効率化に成功しています。
では、どのように学習効率、そしてテスト時の汎用性を上げたかを紹介していきます。
続きを読むには
(4527文字画像7枚)AI-SCHOLARに
登録いただく必要があります。
この記事に関するカテゴリー