Keras + TensorFlow で Ape-X を実装しました。 コードはgithubにあげてあります。 https://github.com/omurammm/apex_dqn 強化学習の知識として、 DQNまでは知っているとわかりやすいと思います。 DQNまでの勉強では以下のサイトが非常に参考になります。 ・ゼロからDeepまで学ぶ強化学習 ・強化学習について学んでみた。(その1) Ape-Xとは 論文:DISTRIBUTED PRIORITIZED EXPERIENCE REPLAY 簡単にいうと、論文のタイトルにもあるように, 優先順位付き経験再生(Prioritized Experience Replay)を分散学習で行おうというやつです。 その性能は・・・ これらのグラフはOpenAI Gym Atari 2600 gamesでテストした結果です。 すごい。。。 学習時間
![【深層強化学習】Ape-X 実装・解説 - Qiita](https://cdn-ak-scissors.b.st-hatena.com/image/square/0e8e1571e12395eb321ea3ecee1c97d8d10333b9/height=288;version=1;width=512/https%3A%2F%2Fqiita-user-contents.imgix.net%2Fhttps%253A%252F%252Fcdn.qiita.com%252Fassets%252Fpublic%252Farticle-ogp-background-9f5428127621718a910c8b63951390ad.png%3Fixlib%3Drb-4.0.0%26w%3D1200%26mark64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTkxNiZoPTMzNiZ0eHQ9JUUzJTgwJTkwJUU2JUI3JUIxJUU1JUIxJUE0JUU1JUJDJUI3JUU1JThDJTk2JUU1JUFEJUE2JUU3JUJGJTkyJUUzJTgwJTkxQXBlLVglMjAlRTUlQUUlOUYlRTglQTMlODUlRTMlODMlQkIlRTglQTclQTMlRTglQUElQUMmdHh0LWNvbG9yPSUyMzIxMjEyMSZ0eHQtZm9udD1IaXJhZ2lubyUyMFNhbnMlMjBXNiZ0eHQtc2l6ZT01NiZ0eHQtY2xpcD1lbGxpcHNpcyZ0eHQtYWxpZ249bGVmdCUyQ3RvcCZzPTEwNmNkNzk3NzJmMjE1ZWQzMjlkNTc5YzZjOGY3YWNj%26mark-x%3D142%26mark-y%3D112%26blend64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTYxNiZ0eHQ9JTQwb211cmFtJnR4dC1jb2xvcj0lMjMyMTIxMjEmdHh0LWZvbnQ9SGlyYWdpbm8lMjBTYW5zJTIwVzYmdHh0LXNpemU9MzYmdHh0LWFsaWduPWxlZnQlMkN0b3Amcz01NWFmYzI1ZmZkYWI0MzQ3NTIxZGQxMDUwOTJkYjg3Yw%26blend-x%3D142%26blend-y%3D491%26blend-mode%3Dnormal%26s%3D42555194e5b3bc925e3df41491182a70)