2. Copyright (C) DeNA Co.,Ltd. All Rights Reserved. Disclaimer ■ 深層強化学習は領域が広く、多くを紹介することは出来ないため、 Rainbow論⽂※で紹介されているDQNを中⼼とした複数アルゴリズム のみ扱います ⁃ Model-free(モデルベース強化学習は扱わない) ⁃ Off-policy(A3C等は扱わない) ⁃ ベンチマークタスクはAtari 2600が主対象(連続⾏動制御等は扱わない) ■ “強化学習を勉強したての⾃分” を想定ターゲットに、「当時こんな資 料があったら理解が進んだな」という要素を盛り込んでいます。 ※ 分かりにくい箇所や、不正確な記載があればコメントください。 ⁃ mail: jun.okumura@dena.com ⁃ Twitter: @pacocat ※ Hessel et al., “R