エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
詳細 強化学習の発展と応用 - ぱたへね
詳細 強化学習の発展と応用読みました。良かったので紹介します。 www.it-book.co.jp 強化学習(第2版)... 詳細 強化学習の発展と応用読みました。良かったので紹介します。 www.it-book.co.jp 強化学習(第2版)とCourseraの強化学習コースをやったの続きになります。 natsutan.hatenablog.com JDLAのE資格でDQNまではなんなとなく勉強していたのでDQNからBCまでの間を埋めるような教材を探していてら、Courseraの強化学習のコースを見つけました。 もともとこういう気持ちでCouseraを始めたけどCouseraはちょっと違っていて、この本はまさにDQNからBCの隙間を埋める本でした。 内容は基本的なところからの説明に入り、re-parameterization trick、PPO、L2C2等のちょっと進んだテクニックの説明があります。既存のやり方では何が問題になっていて、どうやって解決しているのか、結果どうなのかというのが説明してありわかりやすか