2017年10月13日のブックマーク (1件)

  • 強化学習(Q-Learning)でオセロAIを学習させてみた - もふもふ技術部

    年2回、毎度楽しみにしている「開発合宿友の会」の開発合宿に来ております。やはりコード書くのはこの上ない幸せですね。 というわけで、前回強化学習(Q-Learning)で四目並べを学習させてみたというのをやってうまくいかなかったので、別のゲームで実装し直して学習させたらうまくいくかもしれないと思いまして、今回は盤面4x4のオセロのAIを作ってみます。 ソースコードはGitHubにあったオセロの実装をベースに、前回の四目並べのソースコードを組み合わせて実装しました。 全てGitHubにアップしてあります。 https://github.com/harada4atsushi/reversi オセロ実装 ランダム vs ランダム 竜王ミニマックス vs ランダム Q学習 vs 竜王ミニマックス まとめ オセロ実装 盤面の実装。ベースのコードはオブジェクト志向的じゃなく、関数がたくさん実装されている

    強化学習(Q-Learning)でオセロAIを学習させてみた - もふもふ技術部