深層強化学習(DQN)でオセロもどきAIを作ってみた - Qiita

テクノロジーカテゴリーの変更を依頼記事元:

qiita.com/ryo_grid

10 usersがブックマークコメント

コメント

1

記事へのコメント1件

注目コメント
新着コメント

nedokun dqn オセロ　三目並べ　強化学習

2017/05/16 リンク

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

深層強化学習(DQN)でオセロもどきAIを作ってみた - Qiita

どうも、オリィ研究所（http://orylab.com/）の ryo_grid こと神林です。今回は深層強化学習 (DQN) を... どうも、オリィ研究所（http://orylab.com/）の ryo_grid こと神林です。今回は深層強化学習 (DQN) を試してみたので、それについて書いてみます。概要以下を大いに参考（大半のコードを流用させてもらって）にして、(深層)強化学習でオセロもどきのAIを作ってみました。エージェントには駒を多く取ったら勝ちといった知識も与えずに、対戦した勝敗結果(ここの判定だけは学習の時に行う)から打ち方を学ばせます。コードは間違っているとこがあるかもしれないので、指摘してもらえると幸い。なお、エージェント自体の学習ロジックは下記の参考コードからほとんどいじっていません（うまく分離されていて素晴らしい！） ChainerでDQN。強化学習を三目並べでいろいろ試してみた。（Deep Q Network、Q-Learning、モンテカルロ） http://qiita.com/na

ブックマークしたユーザー

nedokun2017/05/16
call_me_nots2016/12/01
sakaiwa2016/12/01
gotoka2016/12/01
yukimori_7262016/11/30
djkldjskadj2016/11/30
kanbayashi2016/11/30

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx