mainyaaのブックマーク / 2016年11月29日

mainyaa id:mainyaa

2016年11月29日のブックマーク (2件)

Chainer✕OpenAI GymでDQN(もどき)に挑戦！ - Qiita
はじめに深層学習と強化学習を組み合わせた Deep Q Network、通称DQNでOpenAI GymのClassic controlを解くプログラムを作ってみました。今回はその実装について紹介したいと思います。 DQN自体については DQNの生い立ち　＋　Deep Q-NetworkをChainerで書いたゼロからDeepまで学ぶ強化学習の記事がとてもわかりやすく、私もこちらで紹介されている論文やGitHubのコードを参考に実装しました。強化学習やDQNの理論を知りたい方はこちらをご参考ください。 DQN"もどき"？ Deep Q Networkという名前からも分かる通り、DQNは強化学習の1つであるQ学習を多層ニューラルネットで関数近似します。それに加え、下記の3つの手法を取り入れて初めてDQNと呼べるみたいです。 Experience Replay Fixed Targ
mainyaa 2016/11/29
強化学習

DQN
リンク
ゲームでAIをトレーニングするジム「OpenAI Gym」の環境構築手順 on Mac OS X - Qiita
OpenAI Gym は、ゲームで人工知能を開発・評価するためのプラットフォームです。「AI用トレーニングジム」を、OpenAIがオープン｜WIRED.jp 環境構築はほとんど手順通りに pip install やら brew install するだけでできて、パックマンとか、スペースインベーダーとか、こういうのをとりあえずお試しとしてランダムに動かしてみるだけなら5行ぐらいのコードでできてしまうので、強化学習とか全然わからないけどとりあえず試してみる、というのも最初の一歩目にいいかもしれません。以下、僕が macOS Sierra で行った環境構築手順です。 OpenAI Gymのインストールインストール手順はREADMEのこちらに書いてあります。
mainyaa 2016/11/29
強化学習

openai
リンク
- 2016年11月30日
- 2016年11月29日
- 2016年11月28日