エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
記事へのコメント1件
- 注目コメント
- 新着コメント
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
NIPS : Conferences : 2014 : Program : NIPS 2014 Accepted Papers
Find an error with your paper? Please login to CMT to fix any errors. Fixes will eventually be pr... Find an error with your paper? Please login to CMT to fix any errors. Fixes will eventually be propagated here. Orals | Spotlights | Posters Orals "How hard is my MDP?" The distribution-norm to the rescue In Reinforcement Learning (RL), state-of-the-art algorithms require a large number of samples per state-action pair to estimate the transition kernel $p$. In many problems, a good approximation o
2014/09/18 リンク