[B! openai] yukimori_726のブックマーク

A How-to on Deep Reinforcement Learning: Setup AWS with Keras/Tensorflow, OpenAI Gym, and Jupyter

yukimori_726 2017/12/19

リンク

Ubuntu14.04にffmpegインストール - Qiita

普通にapt-getで行けるかと思ったらダメだった。調べた感じ、配布されているバイナリを落としてくるか、リポジトリ追加してインストールするかのどちらかかなと思ったが、パッケージとして管理したいので後者で。 sudo apt-get -y install software-properties-common sudo add-apt-repository ppa:mc3man/trusty-media sudo apt-get update sudo apt-get -y install ffmpeg

yukimori_726 2017/09/28

リンク

Open AI GymのCartPoleコードをいじりながら仕組みを学ぶ（１） - Qiita

過去６回で、Ubuntu14.04、CUDA、chainer、dqn、LIS、Tensorflow、Open AI Gymを順次インストールした。特に前回はOpen AI Gymのモデルをいくつか試してみた。 http://qiita.com/masataka46/it ems/227fbfbda98a901f6720 今回はOpen AI GymのHPに載ってるCartPoleゲームのサンプルコードをいじりながら、仕組みを学んでいく。前回と同様、公式HP https://gym.openai.com/docs に従って進める。以下のCartPoleコード(test06.py)をいじりながら仕組みを学ぶ import gym env = gym.make('CartPole-v0') for i_episode in range(20): observation = env.reset()

yukimori_726 2017/06/20

openai

リンク

遺伝的アルゴリズムxニューラルネットワーク（NeuroEvolution）でOpen AI Gymの山登りをさせた話 - Qiita

どうも、オリィ研究所（http://orylab.com/）の ryo_grid こと神林です。今回は前回、Open AI Gymの二足歩行ロボを歩かせたNEATという手法で、他の課題も解けるか試してみようということで、パワー不足の車が振り子の要領で勢いをつけて山を登る、という課題を解かせてみます。前回のお話前回は遺伝的アルゴリズムとニューラルネットワークを組み合わせた手法であるNEAT(NeuroEvolution of Augmenting Topologies)を用いて二足歩行ロボを歩かせました。遺伝的アルゴリズムxニューラルネットワーク（NeuroEvolution）でOpen AI Gymの二足歩行ロボを歩かせた話ただ、パラメータが多数あり、課題ごとにチューニングしないと性能が出ないのではないかという点に疑問が残りました。そこで、今回は上述の課題を同じプログラムを用

yukimori_726 2017/01/27

リンク

遺伝的アルゴリズムxニューラルネットワーク（NeuroEvolution）でOpen AI Gymの二足歩行ロボを歩かせた話 - Qiita

遺伝的アルゴリズムxニューラルネットワーク（NeuroEvolution）でOpen AI Gymの二足歩行ロボを歩かせた話遺伝的アルゴリズムMachineLearningDeepLearning強化学習OpenAIGym どうも、オリィ研究所（http://orylab.com/）の ryo_grid こと神林です。今回は以前試してなかなかうまくいかなかったOpen AI Gymの二足歩行ロボの強化学習へ再チャレンジした話と、その中で知ったNEAT(NeuroEvolution of Augmenting Topologies)という手法について書きたいと思います。前回のお話 DQN(Deep Q-learning Network)という、強化学習の手法を使って二足歩行ロボを歩かせようとしました。結果として、学習自体は成されましたが、まともに歩くというところまではいくことができま

yukimori_726 2017/01/06

openai
dqn

リンク

PythonでAIシミュレーションプラットフォームOpen AI Gym を利用して遊ぶ (DQN編) - Qiita

どうも、オリィ研究所(http://orylab.com/) の ryo_grid こと神林です。今回はOpen AI Gymで遊んでみたので、それについて書いてみます。 Open AI Gym (https://gym.openai.com) とは AI開発者が自分のAIを動かすことのできるシミュレータを提供してくれる環境です。 Python向けにはライブラリを提供しています。 AI GymによりAI開発者やAI研究者はAIの学習ロジックの研究開発に専念でき、その可視化やシミュレーションを行う手間が省けます。また、同じシミュレーションを複数のユーザが競い合って解いているので、参加者全体でのアルゴリズムの性能向上が期待されます。主なターゲットは強化学習によって構築されるAIです。Deep Q-Learning Network(DQN)を代表とする深層強化学習と呼ばれる手法が少し前から話

yukimori_726 2016/12/13

openai
dqn

リンク

Chainer✕OpenAI GymでDQN(もどき)に挑戦！ - Qiita

はじめに深層学習と強化学習を組み合わせた Deep Q Network、通称DQNでOpenAI GymのClassic controlを解くプログラムを作ってみました。今回はその実装について紹介したいと思います。 DQN自体については DQNの生い立ち　＋　Deep Q-NetworkをChainerで書いたゼロからDeepまで学ぶ強化学習の記事がとてもわかりやすく、私もこちらで紹介されている論文やGitHubのコードを参考に実装しました。強化学習やDQNの理論を知りたい方はこちらをご参考ください。 DQN"もどき"？ Deep Q Networkという名前からも分かる通り、DQNは強化学習の1つであるQ学習を多層ニューラルネットで関数近似します。それに加え、下記の3つの手法を取り入れて初めてDQNと呼べるみたいです。 Experience Replay Fixed Targ

yukimori_726 2016/11/28

リンク

ゲームでAIをトレーニングするジム「OpenAI Gym」の環境構築手順 on Mac OS X - Qiita

OpenAI Gym は、ゲームで人工知能を開発・評価するためのプラットフォームです。「AI用トレーニングジム」を、OpenAIがオープン｜WIRED.jp 環境構築はほとんど手順通りに pip install やら brew install するだけでできて、パックマンとか、スペースインベーダーとか、こういうのをとりあえずお試しとしてランダムに動かしてみるだけなら5行ぐらいのコードでできてしまうので、強化学習とか全然わからないけどとりあえず試してみる、というのも最初の一歩目にいいかもしれません。以下、僕が macOS Sierra で行った環境構築手順です。 OpenAI Gymのインストールインストール手順はREADMEのこちらに書いてあります。

yukimori_726 2016/11/28

リンク

はてなブックマーク

タグ

関連タグで絞り込む (9)

openaiに関するyukimori_726のブックマーク (8)

お知らせ

月間はてなブックマーク数ランキング（2024年7月）

今週のはてなブックマーク数ランキング（2024年7月第4週）

今週のはてなブックマーク数ランキング（2024年7月第3週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス