【強化学習】2018年度最強と噂のR2D2を実装/解説してみた - Qiita

テクノロジーカテゴリーの変更を依頼記事元:

qiita.com/pocokhc

2users がブックマークコメント

コメント

1

記事へのコメント1件

注目コメント
新着コメント

misshiki “R2D2(Recurrent Replay Distributed DQN)はざっくりいうと分散学習の Ape-X に時系列データを学習できる LSTM を組み合わせたアルゴリズム”

2019/06/10 リンク

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

【強化学習】2018年度最強と噂のR2D2を実装/解説してみた - Qiita

Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure y... Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? なんとか実装しましたが… 私の技術不足か Keras の限界かは分かりませんがburninの実装に関してはミニバッチ学習と併用できていません。また、ネット上の情報をかき集めて自分なりに実装しているので正確ではないところがある点はご了承ください。追記：ミニバッチ学習についても実装しました。【強化学習】R2D2を実装/解説してみたリベンジ解説編（Keras-RL）追記2：R2D3も実装しました。【強化学習】R2D3を実装/解説してみた（Keras-RL）追記3：Agent57も記事をあげました。【強化学習】ついに人間を超えた

ブックマークしたユーザー

misshiki2019/06/10

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

いま人気の記事 - 企業メディア

企業メディアをもっと読む

設定を変更しましたx