深層強化学習とその最新モデル『R2D2』
3つの要点
✔️ Atari2600ベンチマークで大きな成績の伸長を達成
✔️ 散強化学習Ape-XにRNNを活用
✔️ burn-in phaseの有用性について検証
Recurrent Experience Replay in Distributed Reinforcement Learning
written by Steven Kapturowski, Georg Ostrovski, John Quan, Remi Munos, Will Dabney
(Submitted on 28 Sep 2018 (modified: 25 Jan 2019))
Comments: Published by ICLR 2019
Subjects: Reinforcement Learning
はじめに
今回紹介するのは、来年の国際学会に向けて現在審査中ではあるものの、深層強化学習の分野で圧倒的な精度を出し既にかなり注目されている論文です。まさに最先端の技術ですが、わかりやすくお伝えしようと思います。
AI-SCHOLARで本格的な深層強化学習を扱うのは初めてなので、深層強化学習とは何なのかについても交えて紹介します。
続きを読むには
(4644文字画像7枚)AI-SCHOLARに
登録いただく必要があります。
この記事に関するカテゴリー