タグ

機械学習と強化学習に関するkuppi0216のブックマーク (1)

  • DQNからRainbowまで 〜深層強化学習の最新動向〜

    2. Copyright (C) DeNA Co.,Ltd. All Rights Reserved. Disclaimer ■ 深層強化学習は領域が広く、多くを紹介することは出来ないため、 Rainbow論⽂※で紹介されているDQNを中⼼とした複数アルゴリズム のみ扱います ⁃ Model-free(モデルベース強化学習は扱わない) ⁃ Off-policy(A3C等は扱わない) ⁃ ベンチマークタスクはAtari 2600が主対象(連続⾏動制御等は扱わない) ■ “強化学習を勉強したての⾃分” を想定ターゲットに、「当時こんな資 料があったら理解が進んだな」という要素を盛り込んでいます。 ※ 分かりにくい箇所や、不正確な記載があればコメントください。 ⁃ mail: jun.okumura@dena.com ⁃ Twitter: @pacocat ※ Hessel et al., “R

    DQNからRainbowまで 〜深層強化学習の最新動向〜
  • 1