GoogleのDeepMindが囲碁のルールを自ら学習することでAlphaZeroを凌駕する強化学習手法「Muzero」を提案。 GoogleのDeepMindが囲碁のルールを自ら学習することでAlp ... 2019年12月20日 論文