
エントリーの編集

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
強化学習の系図 - Qiita
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure y... Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 強化学習を一旦掘り下げられるよう整理したかったので, いつ だれが (どんな問題を解いたアルゴリズムで) 何の略称で 親は誰なのか 系図を作ってまとめてみました.(取り違えているかもしれません) 図: 主要な強化学習アルゴリズムの系図(左上の数字は誕生年) TD(λ)(Sutton, 1984;1988) Temporal Differences Sutton, Richard S. "Learning to predict by the methods of temporal differences." Machine learnin