Q 学習→Q network→DQN の順。Q network は関数 Q(s,a) を(複数の)パラメタ θ からなるものとして、θ を学習する。学習にはニューラルネットを使う。

zyxwvzyxwv のブックマーク 2016/06/14 20:10

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

DQNの生い立ち + Deep Q-NetworkをChainerで書いた - Qiita

    はじめに そもそもDQNが作りたかったわけじゃなくて、他の目的でChainerを使いたかったのでその練習にDQNを書いたんですが、せっかくだし公開しようと思いました 公開しました 。またどうせ公開するなら、この機...

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう