[B! アルゴリズム] kuppi0216のブックマーク

kuppi0216 id:kuppi0216

アルゴリズムに関するkuppi0216のブックマーク (2)

DQNからRainbowまで〜深層強化学習の最新動向〜
2. Copyright (C) DeNA Co.,Ltd. All Rights Reserved. Disclaimer ■ 深層強化学習は領域が広く、多くを紹介することは出来ないため、 Rainbow論⽂※で紹介されているDQNを中⼼とした複数アルゴリズムのみ扱います ⁃ Model-free（モデルベース強化学習は扱わない） ⁃ Off-policy（A3C等は扱わない） ⁃ ベンチマークタスクはAtari 2600が主対象（連続⾏動制御等は扱わない） ■ “強化学習を勉強したての⾃分” を想定ターゲットに、「当時こんな資料があったら理解が進んだな」という要素を盛り込んでいます。 ※ 分かりにくい箇所や、不正確な記載があればコメントください。 ⁃ mail: jun.okumura@dena.com ⁃ Twitter: @pacocat ※ Hessel et al., “R
kuppi0216 2018/02/15
アルゴリズム

機械学習

強化学習
リンク
dfltweb1.onamae.com – このドメインはお名前.comで取得されています。
このドメインはお名前.com から取得されました。お名前.com は GMOインターネットグループ(株) が運営する国内シェアNo.1のドメイン登録サービスです。 ※表示価格は、全て税込です。 ※サービス品質維持のため、一時的に対象となる料金へ一定割合の「サービス維持調整費」を加算させていただきます。 ※1 「国内シェア」は、ICANN(インターネットのドメイン名などの資源を管理する非営利団体)の公表数値をもとに集計。gTLDが集計の対象。日本のドメイン登録業者(レジストラ)（「ICANNがレジストラとして認定した企業」一覧（InterNIC提供）内に「Japan」の記載があるもの）を対象。レジストラ「GMO Internet Group, Inc. d/b/a Onamae.com」のシェア値を集計。 2023年5月時点の調査。
kuppi0216 2017/11/17
python

機械学習

アルゴリズム
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx