Deep Q-Network(略称:DQN[1])とは、Googleの子会社DeepMindが2015年に発表した、電子ゲームをプレーする、Q学習と畳み込みニューラルネットワークを組み合わせた強化学習のエージェントである。Atari 2600の49個中29ゲームにおいて人間以上のスコアを獲得できた[1][2]。 概要[編集] 深層学習(畳み込みニューラルネットワーク)と強化学習(Q学習)を組み合わせたアルゴリズムであるDQNで学習したエージェントは、ゲームのルールを教えていない場合でも、どのように操作すれば高得点を目指すことができるのかを判断することができる[3]。この際に、今までの経験をもとにトレーニングを行う「experience replay」と呼ばれるアルゴリズムが大きく貢献していることが分かった[1]。 あるプログラムはAtari 2600の49種類のゲーム中43種類で従来の人工