エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
2017/9/21 Deep Reinforcement Learning That Matters - taki["blog"] = 2024
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
2017/9/21 Deep Reinforcement Learning That Matters - taki["blog"] = 2024
昨日に引き続き「特」をやった。だいたい2.5時間ぐらいPowerpointに向き合っていたけど、こういう地味な... 昨日に引き続き「特」をやった。だいたい2.5時間ぐらいPowerpointに向き合っていたけど、こういう地味な作業はやり始めると集中してできるので良い。それとは別に、今日は微妙に集中力があったので良かった。集中した結果、積んでた実装とは別の実装をやって、雰囲気がつかめて良かった。残りの作業はおそらく来週(月末)に持ち越し。少し遅れているが、おおよそ先週の計画通り(強い(見積もりが低い))。 帰宅したら頭が重かったので、荷造りだけして、他は特に何もせず就寝。 [1709.06560] Deep Reinforcement Learning that Matters どこかで見たことあるようなタイトルの深層強化学習版。中身を簡単に紹介。論文の中身は主にPG(方策勾配法)を使った深層強化学習に関する辛さが書いてあるエッセイみたいなもの(怒られそう)。 TL; DR 深層強化学習の辛いところは外的