タグ

openaiとcodereadingに関するyukimori_726のブックマーク (2)

  • 遺伝的アルゴリズムxニューラルネットワーク(NeuroEvolution)でOpen AI Gymの山登りをさせた話 - Qiita

    どうも、オリィ研究所(http://orylab.com/) の ryo_grid こと神林です。 今回は前回、Open AI Gymの二足歩行ロボを歩かせたNEATという手法で、他の課題も解けるか試してみようということで、パワー不足の車が振り子の要領で勢いをつけて山を登る、という課題を解かせてみます。 前回のお話 前回は遺伝的アルゴリズムとニューラルネットワークを組み合わせた手法であるNEAT(NeuroEvolution of Augmenting Topologies)を用いて二足歩行ロボを歩かせました。 遺伝的アルゴリズムxニューラルネットワーク(NeuroEvolution)でOpen AI Gymの二足歩行ロボを歩かせた話 ただ、パラメータが多数あり、課題ごとにチューニングしないと性能が出ないのではないかという点に疑問が残りました。 そこで、今回は上述の課題を同じプログラムを用

    遺伝的アルゴリズムxニューラルネットワーク(NeuroEvolution)でOpen AI Gymの山登りをさせた話 - Qiita
  • Chainer✕OpenAI GymでDQN(もどき)に挑戦! - Qiita

    はじめに 深層学習と強化学習を組み合わせた Deep Q Network、通称DQNでOpenAI GymのClassic controlを解くプログラムを作ってみました。 今回はその実装について紹介したいと思います。 DQN自体については DQNの生い立ち + Deep Q-NetworkをChainerで書いた ゼロからDeepまで学ぶ強化学習 の記事がとてもわかりやすく、私もこちらで紹介されている論文やGitHubのコードを参考に実装しました。 強化学習やDQNの理論を知りたい方はこちらをご参考ください。 DQN"もどき"? Deep Q Networkという名前からも分かる通り、DQNは強化学習の1つであるQ学習を多層ニューラルネットで関数近似します。 それに加え、下記の3つの手法を取り入れて初めてDQNと呼べるみたいです。 Experience Replay Fixed Targ

    Chainer✕OpenAI GymでDQN(もどき)に挑戦! - Qiita
  • 1