AlphaZeroの仕組みと可能性 2018.02.07 Updated by Ryo Shimizu on February 7, 2018, 08:32 am JST AlphaZeroクローンはあちこちにあるが、どうも将棋とかオセロとか三目並べとか、ありきたりな題材しかない。 AlphaZeroの原理はモンテカルロ探索木なので、原理上は完全情報ゼロ和ゲーム、すなわち盤面の組合せが有限であるものは全て攻略できることになる。 出典:wikipedia Monte Carlo Search Tree しかし囲碁、オセロ、三目並べ、将棋、チェスが攻略できるだけでもそれなりにウレシイが、世の中にある問題の大半は完全情報ではない。現実の問題をAlphaZeroに入力する際には、不完全情報ゲームでも勝てる見込みがないといけない。 ところがいくら探しても僕の見える範囲では不完全情報ゲームを攻略したと
