TensorFlow でビデオゲーム攻略 (1) パックマン / DQN (Deep Q-Network) の実装 DQN – Deep Q Network DeepMind 社で有名になった、DQN (Deep Q-Network) の利用によるビデオゲームの攻略を TensorFlow で実装してみました。 DQN は(強化学習の)Q 学習に深層学習をミックスインしたものです。 Wikipedia によれば、Q 学習 は有限マルコフ決定過程において全ての状態が十分にサンプリングできるようなエピソードを無限回試行した場合、最適な評価値に収束することが理論的に証明されています。 DQN の元々のペーパーは以下ですが : Playing Atari with Deep Reinforcement Learning V. Mnih, K. Kavukcuoglu, D. Silver, A.