[B! openai][chainer] yukimori_726のブックマーク

yukimori_726 id:yukimori_726

openaiとchainerに関するyukimori_726のブックマーク (1)

Chainer✕OpenAI GymでDQN(もどき)に挑戦！ - Qiita
はじめに深層学習と強化学習を組み合わせた Deep Q Network、通称DQNでOpenAI GymのClassic controlを解くプログラムを作ってみました。今回はその実装について紹介したいと思います。 DQN自体については DQNの生い立ち　＋　Deep Q-NetworkをChainerで書いたゼロからDeepまで学ぶ強化学習の記事がとてもわかりやすく、私もこちらで紹介されている論文やGitHubのコードを参考に実装しました。強化学習やDQNの理論を知りたい方はこちらをご参考ください。 DQN"もどき"？ Deep Q Networkという名前からも分かる通り、DQNは強化学習の1つであるQ学習を多層ニューラルネットで関数近似します。それに加え、下記の3つの手法を取り入れて初めてDQNと呼べるみたいです。 Experience Replay Fixed Targ
yukimori_726 2016/11/28
dqn

codereading

chainer

openai
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx