Alpha Zeroが猛烈に三目並べを自己対戦したとき、ついにこの時代が来たと悟った 2018.02.04 Updated by Ryo Shimizu on February 4, 2018, 11:57 am JST AlphaGoを改良したAlpha Zeroが囲碁だけでなくチェスや将棋などを攻略できるようになった、という話を聞いても「今更?」とピンと来なかったまま日々が過ぎていきました。 しかし一昨日ふと気になって、会社に届いたばかりの深層学習PC、DK-1000で試運転がてら実装をいくつか見てみると、AlphaGoのときよりもずっとシンプルな実装になっていて心底驚きました。 試しに、リバーシ(オセロ)とTic-Tac-Toeを実行してみると、猛烈な勢いでAlpha Zeroは自己対戦を始め、どんどんスコアを上げていきます。 最終的にはTic-Tac-Toeを1000回くらい学習し
![Alpha Zeroが猛烈に三目並べを自己対戦したとき、ついにこの時代が来たと悟った](https://cdn-ak-scissors.b.st-hatena.com/image/square/40c30aa991f85d95818124363b8377f7418a6e82/height=288;version=1;width=512/https%3A%2F%2Fwirelesswire.jp%2Fwp-content%2Fuploads%2F2018%2F02%2F20180205-tictactoe-ec2.jpg)