タグ

2016年11月29日のブックマーク (2件)

  • Chainer✕OpenAI GymでDQN(もどき)に挑戦! - Qiita

    はじめに 深層学習と強化学習を組み合わせた Deep Q Network、通称DQNでOpenAI GymのClassic controlを解くプログラムを作ってみました。 今回はその実装について紹介したいと思います。 DQN自体については DQNの生い立ち + Deep Q-NetworkをChainerで書いた ゼロからDeepまで学ぶ強化学習 の記事がとてもわかりやすく、私もこちらで紹介されている論文やGitHubのコードを参考に実装しました。 強化学習やDQNの理論を知りたい方はこちらをご参考ください。 DQN"もどき"? Deep Q Networkという名前からも分かる通り、DQNは強化学習の1つであるQ学習を多層ニューラルネットで関数近似します。 それに加え、下記の3つの手法を取り入れて初めてDQNと呼べるみたいです。 Experience Replay Fixed Targ

    Chainer✕OpenAI GymでDQN(もどき)に挑戦! - Qiita
  • ゲームでAIをトレーニングするジム「OpenAI Gym」の環境構築手順 on Mac OS X - Qiita

    OpenAI Gym は、ゲーム人工知能を開発・評価するためのプラットフォームです。 「AI用トレーニングジム」を、OpenAIがオープン|WIRED.jp 環境構築はほとんど手順通りに pip install やら brew install するだけでできて、 パックマンとか、 スペースインベーダーとか、 こういうのをとりあえずお試しとしてランダムに動かしてみるだけなら5行ぐらいのコードでできてしまうので、強化学習とか全然わからないけどとりあえず試してみる、というのも最初の一歩目にいいかもしれません。 以下、僕が macOS Sierra で行った環境構築手順です。 OpenAI Gymのインストール インストール手順はREADMEの こちら に書いてあります。

    ゲームでAIをトレーニングするジム「OpenAI Gym」の環境構築手順 on Mac OS X - Qiita