tsu-neraのブックマーク - はてなブックマーク

ライントレーサーをDeep Q Learningで教育する - Chainer - Qiita
みなさんライントレーサーってご存知ですか？メカトロの入門として遊んだ方もいくらかいるのではないでしょうか。今回はChainerでやってみるDeep Q Learning - 立ち上げ編に引き続き、基礎体力づくりとしてライントレーサーにDQNで校庭を走らせることにしました。 GitHubにも置きました。良いパラメータやモデル、アルゴリズムなど見つけたら教えてください。 GitHub : DeepQNetworkTest/DQN003.py プログラムの雰囲気ライントレーサーは前記Youtubeのロボと同様に光センサ1個の情報で動きます。走行はmobile robot風に左輪と右輪の速度差などで向きを変えたり前進したりする仕様。慣性はない。線の太さはグラフィックとして書かれている1pxを中心に幅10pxです。緑色そっけないルールベースライントレーサー # 線が見えていると
tsu-nera 2017/06/21
DQN

etロボコン
リンク
ライントレーサーの環境をOpenAI I/F的にした - Qiita
ライントレーサーをDeep Q Learningで教育する - Chainer - Qiitaで取り扱った環境をOpenAI gymライクに扱えるように環境とAIを分離・整備しました。分離したといっても、renderのところを当初wxPythonと描画・ロジック一体で作りこんでしまったので、おかしな状態になっていますが、動くので良しという段階です。この単眼ライントレーサはPOMDPの例ともいえますが、（最初にコース上に乗せる前提で）ロジックベースで動かしてみている人は少なからずいると思います。 POMDPってなんぞというかたは、@okdshinさんが最近親切な説明を書かれていたので、参考にするといいと思います。 ⇒ 外部メモリ（External Memory）を利用した強化学習 - Qiita 先述の以前のチャレンジでは、過去4ステップ分のステートを状態としてDQNにくれてやっていました
tsu-nera 2017/06/08
強化学習

DQN

OpenAI

ETロボコン
リンク
1

はてなブックマーク

タグ

ブックマーク / qiita.com/chachay (2)

お知らせ

今週のはてなブックマーク数ランキング（2024年10月第1週）

月間はてなブックマーク数ランキング（2024年9月）

今週のはてなブックマーク数ランキング（2024年9月第5週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

タグ

ブックマーク / qiita.com/chachay (2)

ライントレーサーをDeep Q Learningで教育する - Chainer - Qiita

ライントレーサーの環境をOpenAI I/F的にした - Qiita

お知らせ

今週のはてなブックマーク数ランキング（2024年10月第1週）

月間はてなブックマーク数ランキング（2024年9月）

今週のはてなブックマーク数ランキング（2024年9月第5週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス