[B! machinelearning][reversi] manabouのブックマーク

manabou id:manabou

machinelearningとreversiに関するmanabouのブックマーク (1)

AlphaGo Zeroの手法でリバーシの強化学習をやってみる - Qiita
はじめに Alpha Go Zeroは、囲碁AIをゼロから強化学習で鍛え上げたもので、それまで最強だったAlpha Go Masterを打ち破るという偉業を成し遂げました。そしてこのZeroの手法自体は結構シンプル、かつ、強くなれるという美味しいところ取りな手法なのです。また、そのゲームの知識を知らなくても実装できます。今回は手法の理解と検証のため、リバーシのAIを育てているので共有します。システム概要ソースコード: https://github.com/mokemokechicken/reversi-alpha-zero 動作環境確認済みなのは以下の環境です。 Python 3.6.3 tensorflow-gpu: 1.3.0 tensorflow==1.3.0 でも動きますが、非常に遅いです。play_guiの時は tensorflow(cpu) でもまあ問題ない感じで動きます。
manabou 2017/10/26
alphago

othello

machinelearning

reversi
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx