[B! openai][codereading] yukimori_726のブックマーク

yukimori_726 id:yukimori_726

openaiとcodereadingに関するyukimori_726のブックマーク (2)

遺伝的アルゴリズムxニューラルネットワーク（NeuroEvolution）でOpen AI Gymの山登りをさせた話 - Qiita
どうも、オリィ研究所（http://orylab.com/）の ryo_grid こと神林です。今回は前回、Open AI Gymの二足歩行ロボを歩かせたNEATという手法で、他の課題も解けるか試してみようということで、パワー不足の車が振り子の要領で勢いをつけて山を登る、という課題を解かせてみます。前回のお話前回は遺伝的アルゴリズムとニューラルネットワークを組み合わせた手法であるNEAT(NeuroEvolution of Augmenting Topologies)を用いて二足歩行ロボを歩かせました。遺伝的アルゴリズムxニューラルネットワーク（NeuroEvolution）でOpen AI Gymの二足歩行ロボを歩かせた話ただ、パラメータが多数あり、課題ごとにチューニングしないと性能が出ないのではないかという点に疑問が残りました。そこで、今回は上述の課題を同じプログラムを用
yukimori_726 2017/01/27
あとで読む

openai

codereading
リンク
Chainer✕OpenAI GymでDQN(もどき)に挑戦！ - Qiita
はじめに深層学習と強化学習を組み合わせた Deep Q Network、通称DQNでOpenAI GymのClassic controlを解くプログラムを作ってみました。今回はその実装について紹介したいと思います。 DQN自体については DQNの生い立ち　＋　Deep Q-NetworkをChainerで書いたゼロからDeepまで学ぶ強化学習の記事がとてもわかりやすく、私もこちらで紹介されている論文やGitHubのコードを参考に実装しました。強化学習やDQNの理論を知りたい方はこちらをご参考ください。 DQN"もどき"？ Deep Q Networkという名前からも分かる通り、DQNは強化学習の1つであるQ学習を多層ニューラルネットで関数近似します。それに加え、下記の3つの手法を取り入れて初めてDQNと呼べるみたいです。 Experience Replay Fixed Targ
yukimori_726 2016/11/28
dqn

codereading

chainer

openai
リンク
1