MuZeroの衝撃。囲碁のルールを自ら学習しAlphaZeroを凌駕。

3つの要点

✔️その1 DeepMindからAlphaZeroの進化版「MuZero」が登場
✔️その2 モデルベース強化学習によりルールを与えなくてもAlphaZeroに勝利
✔️その3 囲碁・チェス・将棋に加えてAtariでも同一モデルで最高性能を達成

 

この記事をシェアする

コメント

人工知能 Deep Learning AI image medical machine learni  @esXFdfOJxiGBFLx
2019/12/20 02:35

囲碁やチェスで勝ったモデルがそのまま!atariに勝つのは今までの常識では難しいはずだったのに https://t.co/TYT02uv1O1

kazuph@配達依存症  @kazuph
2019/12/20 02:33

まだ進化するのか…。 / “MuZeroの衝撃。囲碁のルールを自ら学習しAlphaZeroを凌駕。 | AI-SCHOLAR” https://t.co/sgfDoD8Ydp

Tomoki Morikawa/森川智貴  @xomoki
2019/12/20 02:28

まだまだアップデートされていく😵 そして手前味噌だけど、分かりやすいこの記事! いつも執筆ありがとうございます@shion_honda https://t.co/LoTnC14Von

Shion Honda  @shion_honda
2019/12/20 02:08

モデルベース強化学習を採用し、囲碁でAlphaZero超え・ AtariでR2D2超えを達成したMuZeroの解説記事を書きました。 MuZeroの衝撃。囲碁のルールを自ら学習しAlphaZeroを凌駕。|AI-SCHOLAR https://t.co/LAME2D5W4a @ai_scholar