過去6回で、Ubuntu14.04、CUDA、chainer、dqn、LIS、Tensorflow、Open AI Gymを順次インストールした。特に前回はOpen AI Gymのモデルをいくつか試してみた。 http://qiita.com/masataka46/items/227fbfbda98a901f6720 今回はOpen AI GymのHPに載ってるCartPoleゲームのサンプルコードをいじりながら、仕組みを学んでいく。前回と同様、公式HP https://gym.openai.com/docs に従って進める。 以下のCartPoleコード(test06.py)をいじりながら仕組みを学ぶ import gym env = gym.make('CartPole-v0') for i_episode in range(20): observation = env.reset()
どうも、オリィ研究所(http://orylab.com/) の ryo_grid こと神林です。 今回は前回、Open AI Gymの二足歩行ロボを歩かせたNEATという手法で、他の課題も解けるか試してみようということで、パワー不足の車が振り子の要領で勢いをつけて山を登る、という課題を解かせてみます。 前回のお話 前回は遺伝的アルゴリズムとニューラルネットワークを組み合わせた手法であるNEAT(NeuroEvolution of Augmenting Topologies)を用いて二足歩行ロボを歩かせました。 遺伝的アルゴリズムxニューラルネットワーク(NeuroEvolution)でOpen AI Gymの二足歩行ロボを歩かせた話 ただ、パラメータが多数あり、課題ごとにチューニングしないと性能が出ないのではないかという点に疑問が残りました。 そこで、今回は上述の課題を同じプログラムを用
遺伝的アルゴリズムxニューラルネットワーク(NeuroEvolution)でOpen AI Gymの二足歩行ロボを歩かせた話遺伝的アルゴリズムMachineLearningDeepLearning強化学習OpenAIGym どうも、オリィ研究所(http://orylab.com/) の ryo_grid こと神林です。 今回は以前試してなかなかうまくいかなかったOpen AI Gymの二足歩行ロボの強化学習へ再チャレンジした話と、その中で知ったNEAT(NeuroEvolution of Augmenting Topologies)という手法について書きたいと思います。 前回のお話 DQN(Deep Q-learning Network)という、強化学習の手法を使って二足歩行ロボを歩かせようとしました。 結果として、学習自体は成されましたが、まともに歩くというところまではいくことができま
どうも、オリィ研究所(http://orylab.com/) の ryo_grid こと神林です。 今回はOpen AI Gymで遊んでみたので、それについて書いてみます。 Open AI Gym (https://gym.openai.com) とは AI開発者が自分のAIを動かすことのできるシミュレータを提供してくれる環境です。 Python向けにはライブラリを提供しています。 AI GymによりAI開発者やAI研究者はAIの学習ロジックの研究開発に専念でき、その可視化やシミュレーションを行う手間が省けます。また、同じシミュレーションを複数のユーザが競い合って解いているので、参加者全体でのアルゴリズムの性能向上が期待されます。 主なターゲットは強化学習によって構築されるAIです。Deep Q-Learning Network(DQN)を代表とする深層強化学習と呼ばれる手法が少し前から話
はじめに 深層学習と強化学習を組み合わせた Deep Q Network、通称DQNでOpenAI GymのClassic controlを解くプログラムを作ってみました。 今回はその実装について紹介したいと思います。 DQN自体については DQNの生い立ち + Deep Q-NetworkをChainerで書いた ゼロからDeepまで学ぶ強化学習 の記事がとてもわかりやすく、私もこちらで紹介されている論文やGitHubのコードを参考に実装しました。 強化学習やDQNの理論を知りたい方はこちらをご参考ください。 DQN"もどき"? Deep Q Networkという名前からも分かる通り、DQNは強化学習の1つであるQ学習を多層ニューラルネットで関数近似します。 それに加え、下記の3つの手法を取り入れて初めてDQNと呼べるみたいです。 Experience Replay Fixed Targ
OpenAI Gym は、ゲームで人工知能を開発・評価するためのプラットフォームです。 「AI用トレーニングジム」を、OpenAIがオープン|WIRED.jp 環境構築はほとんど手順通りに pip install やら brew install するだけでできて、 パックマンとか、 スペースインベーダーとか、 こういうのをとりあえずお試しとしてランダムに動かしてみるだけなら5行ぐらいのコードでできてしまうので、強化学習とか全然わからないけどとりあえず試してみる、というのも最初の一歩目にいいかもしれません。 以下、僕が macOS Sierra で行った環境構築手順です。 OpenAI Gymのインストール インストール手順はREADMEの こちら に書いてあります。
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く