[B! 強化学習] kw5のブックマーク

kw5 id:kw5

強化学習に関するkw5のブックマーク (3)

強化学習をする時のベストプラクティスの話 - EnsekiTT Blog
こんにちは、えんせきです。金曜日に久々に徹夜でカラオケしてしまいました。若い！ぼくわかい！金曜日は予定があったので普通に乗り切ったけど、後遺症のせいで土曜日から日曜日にかけて14時間くらい寝ました。スッキリ。つまりなにしたの？ Environment Design Best Practicesを読んだので適用する時に都度英語を読まないで良いように日本語メモにした。読んだやつ github.com 正直、以降の訳文は情報が落ちてるので読めるなら本家のほうが良い。一般的な話ステップバイステップ問題を順に難しくしていくと、短時間でより複雑な課題に対して高い報酬を得られるようになる。カリキュラムラーニングというらしい。できるタスクをやらせる Player Brainでエージェントを制御してタスクを完了できるほうがいいみたい。報酬の話強化学習のチューニングで、すごく大切な報酬の話
kw5 2019/05/09
強化学習

deepracer
リンク
【悲報】ゴールに至らず。差動2駆カートを強化学習で走らせた話 - EnsekiTT Blog
こんにちは、えんせきです。みなさんミニ四駆は好きですか？むかし、僕は大好きで、改造してはよく一人で遊んでいました。は？自動で走るんだから一人で遊ぶ遊びだろ？なんか文句あっか？くぁｗせｄｒｆｔｇｙふじこｌｐ；つまりなにしたの？先日のカートを差動二輪駆動カートにして一本橋を渡りきれるかチャレンジしました。失敗しました。先日のカート ensekitt.hatena blog.com 結果速度が乗ってきたところでスピンしてしまった。必死に落ちないようにしがみついている感じもして少しポイント高い。渡りきれず学習は収束してしまった模様。パラメータたちエージェントに与えた情報現在位置からゴールの位置までの距離カートの姿勢角カートの姿勢角速度タイヤのローカル角速度アクション情報左後輪の目標速度（-3000〜3000）右後輪の目標速度（-3000〜3000）報酬カートと
kw5 2019/05/09
強化学習

deepracer
リンク
強化学習入門～これから強化学習を学びたい人のための基礎知識～ - Platinum Data Blog by BrainPad
こんにちは。アナリティクスサービス本部の仲田です。本日は、「強化学習」について、その基礎的なアルゴリズムと、簡単なデモをご紹介します。強化学習とは機械学習の手法のひとつ (画像はhttps://www.engadget.com/2016/03/12/watch-alpha go-vs-lee-sedol-round-3-live-right-now/より) 「強化学習（Reinforcement Learning）」と呼ばれる学問分野をご存知でしょうか。機械学習にはさまざまな分類方法がありますが、「教師付き学習（Supervised Learning）」「教師なし学習（Unsupervised Learning）」「強化学習」という3種類に分ける考え方があります。この考え方では、強化学習は機械学習のひとつの大きな分野をなすということになります。 (画像は UCL Course on
kw5 2019/05/09
強化学習
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx