Atari完全制覇! Atari57ゲーム全てで人間を超えたAgent57とは!?
3つの要点
✔️ Atari57ゲーム全てで人間の性能を超える強化学習
✔️ 既存の強化学習の進化形
✔️ 状態行動価値Qの分離、メタコントローラの導入により性能向上
Agent57: Outperforming the Atari Human Benchmark
written by Adrià Puigdomènech Badia, Bilal Piot, Steven Kapturowski, Pablo Sprechmann, Alex Vitvitskyi, Daniel Guo, Charles Blundell
(Submitted on 30 Mar 2020)
Comments: Published as a conference paper in ICLR 2020
Subjects: Machine Learning (cs.LG); Machine Learning (stat.ML)
強化学習におけるベンチマークとして、Atari2600という一連のゲームがよく用いられます。しかし既存の強化学習手法では、このAtariのゲーム57種類全てのゲームで人間を超えることはできていませんでした。
今回紹介するAgent57は、このAtariのゲーム57種類全てにおいて人間を超える成績を発揮した最初の強化学習手法となります。
また、このAgent57は、画期的な発明というより、既存の強化学習アルゴリズムの組み合わせという側面が非常に強いです。そのため、Agent57の完全な理解には、その前身となるNGU(Never Give Up)についての知識が重要となります。
続きを読むには
(7233文字画像6枚)AI-SCHOLARに
登録いただく必要があります。
この記事に関するカテゴリー