概要 書籍「実装 ディープラーニング」の三目並べサンプルをベースに、オセロゲームを自作して DQN(Experience Replay)強化学習を実施してみました。 今回は、スクリプトの紹介と、実行結果について考察を書いてみます。 ご意見や間違いのご指摘などありましたら、コメントいただければ幸いです。 コードはこちらにあります。 https://github.com/Kumapapa2012/Learning-Machine-Learning/tree/master/Reversi 後続の記事はこちら。 オセロ~「実装 ディープラーニング」の三目並べより(2) http://qiita.com/Kumapapa2012/items/f6c654d7c789a074c69b オセロ~「実装 ディープラーニング」の三目並べより(3) http://qiita.com/Kumapapa2012/