サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
iPhone 16
qiita.com/utarumo
Keras + TensorFlow で Ape-X を実装しました。 コードはgithubにあげてあります。 https://github.com/omurammm/apex_dqn 強化学習の知識として、 DQNまでは知っているとわかりやすいと思います。 DQNまでの勉強では以下のサイトが非常に参考になります。 ・ゼロからDeepまで学ぶ強化学習 ・強化学習について学んでみた。(その1) Ape-Xとは 論文:DISTRIBUTED PRIORITIZED EXPERIENCE REPLAY 簡単にいうと、論文のタイトルにもあるように, 優先順位付き経験再生(Prioritized Experience Replay)を分散学習で行おうというやつです。 その性能は・・・ これらのグラフはOpenAI Gym Atari 2600 gamesでテストした結果です。 すごい。。。 学習時間
このページを最初にブックマークしてみませんか?
『qiita.com』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く