[B! 機械学習][強化学習] kuppi0216のブックマーク

kuppi0216 id:kuppi0216

機械学習と強化学習に関するkuppi0216のブックマーク (1)

DQNからRainbowまで〜深層強化学習の最新動向〜
2. Copyright (C) DeNA Co.,Ltd. All Rights Reserved. Disclaimer ■ 深層強化学習は領域が広く、多くを紹介することは出来ないため、 Rainbow論⽂※で紹介されているDQNを中⼼とした複数アルゴリズムのみ扱います ⁃ Model-free（モデルベース強化学習は扱わない） ⁃ Off-policy（A3C等は扱わない） ⁃ ベンチマークタスクはAtari 2600が主対象（連続⾏動制御等は扱わない） ■ “強化学習を勉強したての⾃分” を想定ターゲットに、「当時こんな資料があったら理解が進んだな」という要素を盛り込んでいます。 ※ 分かりにくい箇所や、不正確な記載があればコメントください。 ⁃ mail: jun.okumura@dena.com ⁃ Twitter: @pacocat ※ Hessel et al., “R
kuppi0216 2018/02/15
アルゴリズム

機械学習

強化学習
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx