深層強化学習とその最新モデル『R2D2』

深層強化学習とその最新モデル『R2D2』

3つの要点
✔️ Atari2600ベンチマークで大きな成績の伸長を達成
✔️ 散強化学習Ape-XにRNNを活用

✔️ burn-in phaseの有用性について検証

Recurrent Experience Replay in Distributed Reinforcement Learning
written by Steven KapturowskiGeorg OstrovskiJohn QuanRemi MunosWill Dabney
(Submitted on 28 Sep 2018 (modified: 25 Jan 2019))

Comments: Published by ICLR 2019
Subjects: Reinforcement Learning

はじめに

今回紹介するのは、来年の国際学会に向けて現在審査中ではあるものの、深層強化学習の分野で圧倒的な精度を出し既にかなり注目されている論文です。まさに最先端の技術ですが、わかりやすくお伝えしようと思います。

AI-SCHOLARで本格的な深層強化学習を扱うのは初めてなので、深層強化学習とは何なのかについても交えて紹介します。

この記事をシェアする