[B! 強化学習][倒立振子] chess-newsのブックマーク

chess-news id:chess-news

強化学習と倒立振子に関するchess-newsのブックマーク (2)

Gym
Gym is a standard API for reinforcement learning, and a diverse collection of reference environments# The Gym interface is simple, pythonic, and capable of representing general RL probl ems: import gym env = gym.make("LunarLander-v2", render_mode="human") observation, info = env.reset(seed=42) for _ in range(1000): action = policy(observation) # User-defined policy function observation, reward, ter
chess-news 2017/05/13
　環境　モデル

機械学習

強化学習

python

tensorflow

OpenAI_Gym

倒立振子
リンク
倒立振子で学ぶ DQN (Deep Q Network) - Qiita
強化学習の一手法であるQ-learning とディープニューラルネットを組み合わせた Deep Q Network、通称DQNを使って倒立振子の振り上げ問題を解決してみます。問題設定「倒立振子の振り上げ問題」というのは、今回はこういう問題設定です。まず空中に静止したモータがあって、モータ軸に棒の一端がつながっています。棒は中心に質量が集中していて剛性$\infty$で太さ0の、よくある棒です。初期状態では棒は重力にしたがって下向きにぶら下がっています。この状態から振り子を振り上げて倒立状態で静止させてください、という問題です。古きよき制御工学では、振り上げ用と静止用に別設計されたコントローラを2つ用意して切り替えるなど、非線形要素を含むコントローラを用いて対処することになります。いや、やったことないですけど、そうらしいです。今回は、モータは右か左に一定トルクの回転しかできない、とし
chess-news 2017/04/30
機械学習

deeplearning

倒立振子

dqn

machinelearning

強化学習

qlearning

deep q learning
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx