タグ

ブックマーク / qiita.com/yuishihara (2)

  • いまさらだけどTensorFlowでDQN(不完全版)を実装する - Qiita

    {\begin{align} n &\leftarrow \rho n + (1-\rho)g_r^2 \\ g &\leftarrow \rho g + (1-\rho)g_r \\ m &\leftarrow \beta m - \frac \alpha {(n - g^2 + \gamma)}g_r \end{align}} イメージ的には、RMSPropが平均的な傾きの大きさを見て、値の更新幅を変えるのに対して、RMSPropGravesは傾きの分散に応じて、更新幅を変える感じでしょうか。 あとここで実装したDQNが、もう一点オリジナルと違うのは、通常のRMSPropを使う関係で、論文にあるLoss Clippingも行いません。 理由は、Clippingしたら、まともに学習が進まなかったからです・・・ DQN(不完全版)を実装するには 必要なライブラリ等 TensorFlow A

    いまさらだけどTensorFlowでDQN(不完全版)を実装する - Qiita
  • 素人がCaffeを使ってDeepLearningしてみた(導入編) - Qiita

    はじめに この記事は 1. Deep Learningって何?を説明する 概要編 2. Deep Learningライブラリの一つであるCaffeのインストールする 導入編(この投稿) 3. Caffeを使って簡単な学習をさせてみる 実践編 の三構成になっています タイトルにもありますが、Deep Learningの研究者でもなんでもない素人が残した記録程度の投稿なので、間違った記述があるかもしれない点はご容赦いただき、読んでいただくようお願いします (もしおかしい点があればコメントで指摘していただけると嬉しいです) インストール環境 OS:Ubuntu 14.04 LTS CPU: Core i7 2.93GHz GPU: GeForce GTX 960 メモリ: 4GB Caffeインストール手順 基的にはCaffe公式ページに書いてある通りにやります ここでは、構成を下記の様にし

    素人がCaffeを使ってDeepLearningしてみた(導入編) - Qiita
  • 1