Dueling Network Architectures for Deep Reinforcement Learning [arXiv:1511.06581] 概要 Dueling Network Architectures for Deep Reinforcement Learning を読んだ Double DQNにDueling Networkを組み込んだ DQN・Double DQNと比較した はじめに この論文は新しい強化学習のアルゴリズムを提案するのではなく、Q関数の内部構造に変更を加えたDueling Architectureを提案しています。 そのためQ関数を用いた強化学習全般に適用でき、導入する際のコードの変更も少なくて済みます。 Dueling Architecture まずQ関数を以下のように分解します。 \[\begin{align} Q(s,a)=\hat{V}
![Dueling Network Architectures for Deep Reinforcement Learning [arXiv:1511.06581]](https://cdn-ak-scissors.b.st-hatena.com/image/square/19cd375d719281c303d0dccd7496fb5c4f69620c/height=288;version=1;width=512/http%3A%2F%2Fmusyoku.github.io%2Fimages%2Fpost%2F2016-03-27%2Fepisode_reward.png)