AlphaZeroの意外な構造またはAlphaGoは如何にして棋譜データの利用をやめて自分の経験に頼るようになったか

AlphaGoから進化したAlphaZeroの強化学習アルゴリズム：人の知識なしでゼロから学習に成功した強化学習モデルのゲームＡＩ「AlphaZero」の学習モデルとモンテカルロ木探索を数式とイラストで解説していきます。将棋ＡＩとしても.

AlphaZeroの意外な構造またはAlphaGoは如何にして棋譜データの利用をやめて自分の経験に頼るようになったか

Instructor内山充康

Duration4h 57m

Students161

Rating4.1 (18)