[B! 強化学習][OpenAI] tsu-neraのブックマーク

gym-cartpole/cartpole.py at 0788239f2c1be0b694a1b90a376780e1a8603bab · krocki/gym-cartpole

tsu-nera 2017/07/05

リンク

Policy Gradient to solve CartPole-v0 in OpenAI gym

tsu-nera 2017/07/05

リンク

Home - Ike-ON

Unlock Your Potential: Top 10 Reasons to Learn Python Python is one of the most popular programming languages in the world. As techno logy advances and more companies use Python … Read More C# course from scratch for beginners If you have only a general idea of what programming is and have never been professionally engaged in it, we recommend that you start learning from the very basics. Read More

tsu-nera 2017/07/05

リンク

GitHub - dennybritz/reinforcement-learning: Implementation of Reinforcement Learning Algorithms. Python, OpenAI Gym, Tensorflow. Exercises and Solutions to accompany Sutton's Book and David Silver's course.

You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

tsu-nera 2017/06/10

リンク

ライントレーサーの環境をOpenAI I/F的にした - Qiita

ライントレーサーをDeep Q Learningで教育する - Chainer - Qiitaで取り扱った環境をOpenAI gymライクに扱えるように環境とAIを分離・整備しました。分離したといっても、renderのところを当初wxPythonと描画・ロジック一体で作りこんでしまったので、おかしな状態になっていますが、動くので良しという段階です。この単眼ライントレーサはPOMDPの例ともいえますが、（最初にコース上に乗せる前提で）ロジックベースで動かしてみている人は少なからずいると思います。 POMDPってなんぞというかたは、@okdshinさんが最近親切な説明を書かれていたので、参考にするといいと思います。 ⇒ 外部メモリ（External Memory）を利用した強化学習 - Qiita 先述の以前のチャレンジでは、過去4ステップ分のステートを状態としてDQNにくれてやっていました

tsu-nera 2017/06/08

リンク

[Python] Keras-RLで簡単に強化学習(DQN)を試す - Qiita

はじめに強化学習を試してみたい題材はあるけど、自分でアルゴリズムを実装するのは・・・という方向けに、オリジナルの題材の環境を用意し、keras-rlで強化学習するまでの流れを説明します。実行時の環境 Python 3.5 keras 1.2.0 keras-rl 0.2.0rc1 Jupyter notebook 使用するライブラリ keras 簡単にネットワークが構築できると話題のディープラーニングのフレームワークです。 keras-rl kerasを利用して、DQNなどの深層強化学習のアルゴリズムを実装したライブラリです。対応しているアルゴリズムはこちらを参照。 gitのリポジトリをcloneしてインストールします。

tsu-nera 2017/06/08

リンク

OpenAI GymでQ学習してみた - The jonki

今更ながらOpenAI Gymに手を出してみました．OpenAI Gymは強化学習の検証プラットフォームです．色々なゲームがGymとしてあるので，自分のアルゴリズムを簡単に検証できます．以前最良経路をQ学習で求める記事を書きましたが，Gym向けに書けばGUIも付いてきて面白いですし，コードをGistで共有していろんな人が見れるのが素晴らしいですね．OpenAI GymについてはQiitaなどの日本語記事も多くありますが，公式ドキュメントをさらっとやるのが良いと思います．pipで簡単に入ります．また結果のアップロード法なども書いてあります． OpenAI Gym Q学習で最良経路をPythonで求めてみる - The jonki この記事は私がDQNを勉強するにあたっての勉強段階のメモになりますが，せっかくなので記事にしておきます．今回やろうとしたことは下記サイトさまの完全な２番煎じです．

tsu-nera 2017/06/08

リンク

OpenAI Gym を触ってみる - 壁は通り抜けられませんよ

OpenAI Gymなる強化学習用プラットフォームを触ってみました(参考: PyConJPのプレゼンテーション)。インストール自体はpip install gymで一発です(Atariゲームなどを扱いたい場合はpip install gym[atari]のようにサブパッケージをインストールする必要があるようです)。一応ドキュメントで使い方は説明されていますが、若干戸惑う点があったので随時補足します。 Atariゲームなど色々面白そうな環境がありますが、とりあえずFrozenLake(4x4, 8x8)というのが初心者向けっぽいので、これを試してみました。ルールは非常に単純で、固定配置のマップ上でスタートから穴に落ちずにゴールに辿り着くだけです。成功時1点、失敗時0点の報酬が得られます。マップ上の記号の意味は以下の通り: 記号意味 S スタート F 床 H 穴 G ゴールただしスター

tsu-nera 2017/06/08

リンク

はてなブックマーク

タグ

関連タグで絞り込む (5)

強化学習とOpenAIに関するtsu-neraのブックマーク (8)

お知らせ

今週のはてなブックマーク数ランキング（2024年6月第4週）

今週のはてなブックマーク数ランキング（2024年6月第3週）

今週のはてなブックマーク数ランキング（2024年6月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス