ko-ya-maのブックマーク - はてなブックマーク

ko-ya-ma id:ko-ya-ma

ブックマーク / qiita.com/shionhonda (1)

深層強化学習アルゴリズムまとめ
はじめに深層強化学習の分野では日進月歩で新たなアルゴリズムが提案されています. それらを学ぶ上で基礎となるアルゴリズム(というより概念に近い？)はQ学習, SARSA, 方策勾配法, Actor-Criticの4つだと思われるので, これらを軸としてまとめてみたいと思います. 以下の4点はあらかじめご了承ください. コードは書いていません. 概念のみの説明です他のアルゴリズムの基礎となりうる重要な概念については詳しく書きました. その他については簡潔に書きました深層学習についてはある程度理解している読者を想定しています書いているうちに規模がどんどん大きくなってしまったので, どこかに必ず間違いや不足があります. 「この式がおかしい！」「このアルゴリズムも追加するべき！」などコメントがあればぜひお願いします全体像扱うアルゴリズムを相関図にしてみました(私のイメージです). まず,
ko-ya-ma 2018/11/06
dev

deeplearning

algorithm

まとめ

math
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx