いまさらだけどTensorFlowでDQN(不完全版)を実装する - Qiita

テクノロジーカテゴリーの変更を依頼記事元:

qiita.com/yuishihara

11 usersがブックマークコメント

コメント

0

記事へのコメント0件

注目コメント
新着コメント

新着コメントはまだありません。
このエントリーにコメントしてみましょう。

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

いまさらだけどTensorFlowでDQN(不完全版)を実装する - Qiita

{\begin{align} n &\leftarrow \rho n + (1-\rho)g_r^2 \\ g &\leftarrow \rho g + (1-\rho)g_r \\ m &\... {\begin{align} n &\leftarrow \rho n + (1-\rho)g_r^2 \\ g &\leftarrow \rho g + (1-\rho)g_r \\ m &\leftarrow \beta m - \frac \alpha {(n - g^2 + \gamma)}g_r \end{align}} イメージ的には、RMSPropが平均的な傾きの大きさを見て、値の更新幅を変えるのに対して、RMSPropGravesは傾きの分散に応じて、更新幅を変える感じでしょうか。あとここで実装したDQNが、もう一点オリジナルと違うのは、通常のRMSPropを使う関係で、論文にあるLoss Clippingも行いません。理由は、Clippingしたら、まともに学習が進まなかったからです・・・ DQN(不完全版)を実装するには必要なライブラリ等 TensorFlow A

ブックマークしたユーザー

aidiary2017/02/20
stoikheia2016/08/09
carmanned2016/07/29
riyokotter2016/07/26
ginga01182016/07/26
toshiemon182016/07/25
yukimori_7262016/07/25
roomba2016/07/25
ayaniimi2132016/07/25

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx