kw5のブックマーク - はてなブックマーク

強化学習をする時のベストプラクティスの話 - EnsekiTT Blog
こんにちは、えんせきです。金曜日に久々に徹夜でカラオケしてしまいました。若い！ぼくわかい！金曜日は予定があったので普通に乗り切ったけど、後遺症のせいで土曜日から日曜日にかけて14時間くらい寝ました。スッキリ。つまりなにしたの？ Environment Design Best Practicesを読んだので適用する時に都度英語を読まないで良いように日本語メモにした。読んだやつ github.com 正直、以降の訳文は情報が落ちてるので読めるなら本家のほうが良い。一般的な話ステップバイステップ問題を順に難しくしていくと、短時間でより複雑な課題に対して高い報酬を得られるようになる。カリキュラムラーニングというらしい。できるタスクをやらせる Player Brainでエージェントを制御してタスクを完了できるほうがいいみたい。報酬の話強化学習のチューニングで、すごく大切な報酬の話
kw5 2019/05/09
強化学習

deepracer
リンク
【悲報】ゴールに至らず。差動2駆カートを強化学習で走らせた話 - EnsekiTT Blog
こんにちは、えんせきです。みなさんミニ四駆は好きですか？むかし、僕は大好きで、改造してはよく一人で遊んでいました。は？自動で走るんだから一人で遊ぶ遊びだろ？なんか文句あっか？くぁｗせｄｒｆｔｇｙふじこｌｐ；つまりなにしたの？先日のカートを差動二輪駆動カートにして一本橋を渡りきれるかチャレンジしました。失敗しました。先日のカート ensekitt.hatena blog.com 結果速度が乗ってきたところでスピンしてしまった。必死に落ちないようにしがみついている感じもして少しポイント高い。渡りきれず学習は収束してしまった模様。パラメータたちエージェントに与えた情報現在位置からゴールの位置までの距離カートの姿勢角カートの姿勢角速度タイヤのローカル角速度アクション情報左後輪の目標速度（-3000〜3000）右後輪の目標速度（-3000〜3000）報酬カートと
kw5 2019/05/09
強化学習

deepracer
リンク
1

はてなブックマーク

タグ

ブックマーク / ensekitt.hatenablog.com (2)

お知らせ

今週のはてなブックマーク数ランキング（2024年8月第4週）

今週のはてなブックマーク数ランキング（2024年8月第3週）

今週のはてなブックマーク数ランキング（2024年8月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

タグ

ブックマーク / ensekitt.hatenablog.com (2)

強化学習をする時のベストプラクティスの話 - EnsekiTT Blog

【悲報】ゴールに至らず。差動2駆カートを強化学習で走らせた話 - EnsekiTT Blog

お知らせ

今週のはてなブックマーク数ランキング（2024年8月第4週）

今週のはてなブックマーク数ランキング（2024年8月第3週）

今週のはてなブックマーク数ランキング（2024年8月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス