はじめに 少し時代遅れかもしれませんが、強化学習の手法のひとつであるDQNをDeepMindの論文Mnih et al., 2015, Human-level control through deep reinforcement learningを参考にしながら、KerasとTensorFlowとOpenAI Gymを使って実装します。 前半では軽くDQNのおさらいをしますが、少しの強化学習の知識を持っていることを前提にしています。 すでにいくつか良記事が出ているので紹介したいと思います。合わせて読むと理解の助けになると思うので、是非参考にしてみてください。 DQNの生い立ち + Deep Q-NetworkをChainerで書いた DQNが生まれた背景について説明してくれています。Chainerでの実装もあるそうです。 ゼロからDeepまで学ぶ強化学習 タイトルの通り、ゼロからDeepま
![DQNをKerasとTensorFlowとOpenAI Gymで実装する](https://cdn-ak-scissors.b.st-hatena.com/image/square/10426cea3e9320a508915d44a4b334d9bc644e4e/height=288;version=1;width=512/https%3A%2F%2Felix-tech.github.io%2Fimages%2F2016%2Fbasic-dqn%2Fbreakout.png)