yuta-hornのブックマーク / 2017年10月13日

強化学習(Q-Learning)でオセロAIを学習させてみた - もふもふ技術部

年2回、毎度楽しみにしている「開発合宿友の会」の開発合宿に来ております。やはりコード書くのはこの上ない幸せですね。というわけで、前回強化学習(Q-Learning)で四目並べを学習させてみたというのをやってうまくいかなかったので、別のゲームで実装し直して学習させたらうまくいくかもしれないと思いまして、今回は盤面4x4のオセロのAIを作ってみます。ソースコードはGitHubにあったオセロの実装をベースに、前回の四目並べのソースコードを組み合わせて実装しました。全てGitHubにアップしてあります。 https://github.com/harada4atsushi/reversi オセロ実装ランダム vs ランダム竜王ミニマックス vs ランダム Q学習 vs 竜王ミニマックスまとめオセロ実装盤面の実装。ベースのコードはオブジェクト志向的じゃなく、関数がたくさん実装されている

はてなブックマーク

タグ

2017年10月13日のブックマーク (1件)

強化学習(Q-Learning)でオセロAIを学習させてみた - もふもふ技術部

お知らせ

今週のはてなブックマーク数ランキング（2024年9月第2週）

月間はてなブックマーク数ランキング（2024年8月）

今週のはてなブックマーク数ランキング（2024年9月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス