[B! algorithm][architecture][reinforcementlearning] yukimori_726のブックマーク

yukimori_726 id:yukimori_726

algorithmとarchitectureとreinforcementlearningに関するyukimori_726のブックマーク (1)

Dueling Network Architectures for Deep Reinforcement Learning [arXiv:1511.06581]
Dueling Network Architectures for Deep Reinforcement Learning [arXiv:1511.06581] 概要 Dueling Network Architectures for Deep Reinforcement Learning を読んだ Double DQNにDueling Networkを組み込んだ DQN・Double DQNと比較したはじめにこの論文は新しい強化学習のアルゴリズムを提案するのではなく、Q関数の内部構造に変更を加えたDueling Architectureを提案しています。そのためQ関数を用いた強化学習全般に適用でき、導入する際のコードの変更も少なくて済みます。 Dueling Architecture まずQ関数を以下のように分解します。 \[\begin{align} Q(s,a)=\hat{V}
yukimori_726 2016/07/04
dqn

architecture

algorithm

reinforcementlearning
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx