【強化学習初心者向け】シンプルな実装例で学ぶQ学習、DQN、DDQN【CartPoleで棒立て:1ファイルで完結、Kearas使用】Python機械学習DeepLearning強化学習Keras ※2018年06月23日追記 PyTorchを使用した最新版の内容を次の書籍にまとめました。 つくりながら学ぶ! 深層強化学習 ~PyTorchによる実践プログラミング~ 18年6月28日発売 「倒立振子(棒立て問題)」を、強化学習のQ学習、DQNおよびDDQN(Double DQN)で実装・解説したので、紹介します。 ディープラーニングのライブラリにはKerasを使用しました。 (※追記:17/09/27にHuber関数部分を修正しました) (※追記:17/10/01にQ学習更新のr抜けを修正しました) (※追記:17/10/03にQ学習報酬のrewardを修正しました) (※追記:18/05/
![【強化学習初心者向け】シンプルな実装例で学ぶQ学習、DQN、DDQN【CartPoleで棒立て:1ファイルで完結、Kearas使用】 - Qiita](https://cdn-ak-scissors.b.st-hatena.com/image/square/931b54479e474db30095ac83b72fed3f7a07d043/height=288;version=1;width=512/https%3A%2F%2Fqiita-user-contents.imgix.net%2Fhttps%253A%252F%252Fcdn.qiita.com%252Fassets%252Fpublic%252Farticle-ogp-background-412672c5f0600ab9a64263b751f1bc81.png%3Fixlib%3Drb-4.0.0%26w%3D1200%26mark64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTk3MiZoPTM3OCZ0eHQ9JUUzJTgwJTkwJUU1JUJDJUI3JUU1JThDJTk2JUU1JUFEJUE2JUU3JUJGJTkyJUU1JTg4JTlEJUU1JUJGJTgzJUU4JTgwJTg1JUU1JTkwJTkxJUUzJTgxJTkxJUUzJTgwJTkxJUUzJTgyJUI3JUUzJTgzJUIzJUUzJTgzJTk3JUUzJTgzJUFCJUUzJTgxJUFBJUU1JUFFJTlGJUU4JUEzJTg1JUU0JUJFJThCJUUzJTgxJUE3JUU1JUFEJUE2JUUzJTgxJUI2USVFNSVBRCVBNiVFNyVCRiU5MiVFMyU4MCU4MURRTiVFMyU4MCU4MUREUU4lRTMlODAlOTBDYXJ0UG9sZSVFMyU4MSVBNyVFNiVBMyU5MiVFNyVBQiU4QiVFMyU4MSVBNiVFRiVCQyU5QTElRTMlODMlOTUlRTMlODIlQTElRTMlODIlQTQlRTMlODMlQUIlRTMlODElQTclRTUlQUUlOEMlRTclQjUlOTAlRTMlODAlODFLZWElRTIlODAlQTYmdHh0LWFsaWduPWxlZnQlMkN0b3AmdHh0LWNvbG9yPSUyMzIxMjEyMSZ0eHQtZm9udD1IaXJhZ2lubyUyMFNhbnMlMjBXNiZ0eHQtc2l6ZT01NiZzPWQ2MTgzMDk0NGE1OTQ4ZDYzYzU4OTAwOTkwYjhjN2Fl%26mark-x%3D142%26mark-y%3D57%26blend64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZoPTc2Jnc9NzcwJnR4dD0lNDBzdWd1bHVfT2dhd2FfSVNJRCZ0eHQtY29sb3I9JTIzMjEyMTIxJnR4dC1mb250PUhpcmFnaW5vJTIwU2FucyUyMFc2JnR4dC1zaXplPTM2JnR4dC1hbGlnbj1sZWZ0JTJDdG9wJnM9YmZjMGMwN2I5ZTkyNGFkMTM1ODRiNTMzMTdiMWU3NDM%26blend-x%3D142%26blend-y%3D486%26blend-mode%3Dnormal%26s%3D1bb48c4ad2ea48570bcfd7d63b638a9b)