はじめに 強化学習よくわからないけど,理論そっちのけでとりあえずパパッと動かして見たいせっかちな人向けです.つまり僕のような人間です. OpenAI Gymで,強化学習の環境を提供してくれているので,それを用います. OpenAI Gymはあくまでも環境だけで,実際に学習させるには他のものが必要です. 調べて見ると,Kerasで強化学習をやるkeras-rlを書いた人がいて,これを使うと簡単に試せそうだったので使います.先人に感謝. 環境の準備 今回の環境 Python 3.6.0 :: Anaconda 4.3.1 (x86_64) Mac OS Sierra 10.12.5 keras 2.0.5 (backend tensorflow) tensorflow 1.2.0 最初はディスプレイのないサーバーでやっていましたが,めんどくさかったので,ローカル環境でやりました. ちなみにディ
![Kerasで最短で強化学習(reinforcement learning)する with OpenAI Gym - Qiita](https://cdn-ak-scissors.b.st-hatena.com/image/square/d33eafe92757026616215a8959920e3a7ac994e0/height=288;version=1;width=512/https%3A%2F%2Fqiita-user-contents.imgix.net%2Fhttps%253A%252F%252Fcdn.qiita.com%252Fassets%252Fpublic%252Farticle-ogp-background-9f5428127621718a910c8b63951390ad.png%3Fixlib%3Drb-4.0.0%26w%3D1200%26mark64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTkxNiZoPTMzNiZ0eHQ9S2VyYXMlRTMlODElQTclRTYlOUMlODAlRTclOUYlQUQlRTMlODElQTclRTUlQkMlQjclRTUlOEMlOTYlRTUlQUQlQTYlRTclQkYlOTIlRUYlQkMlODhyZWluZm9yY2VtZW50JTIwbGVhcm5pbmclRUYlQkMlODklRTMlODElOTklRTMlODIlOEIlMjB3aXRoJTIwT3BlbkFJJTIwR3ltJnR4dC1jb2xvcj0lMjMyMTIxMjEmdHh0LWZvbnQ9SGlyYWdpbm8lMjBTYW5zJTIwVzYmdHh0LXNpemU9NTYmdHh0LWNsaXA9ZWxsaXBzaXMmdHh0LWFsaWduPWxlZnQlMkN0b3Amcz0wY2Y0NzU5OWU2MzEzOWY3Y2MzNzhkNDRkM2Q1NmU4NQ%26mark-x%3D142%26mark-y%3D112%26blend64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTYxNiZ0eHQ9JTQwa2F6ZXRvZiZ0eHQtY29sb3I9JTIzMjEyMTIxJnR4dC1mb250PUhpcmFnaW5vJTIwU2FucyUyMFc2JnR4dC1zaXplPTM2JnR4dC1hbGlnbj1sZWZ0JTJDdG9wJnM9M2ZlZjc0OTQ0OGVhMDU0NjBkODdiNGNkZDM3OThjZjI%26blend-x%3D142%26blend-y%3D491%26blend-mode%3Dnormal%26s%3Dd3e0b2106361216229ab7768e9e6ca4d)