[B! 強化学習] suu-gのブックマーク

suu-g id:suu-g

強化学習に関するsuu-gのブックマーク (1)

http://stlabwww.ssi.ist.hokudai.ac.jp/yuhyama/lecture/softcomputing/softcomputing-b-4up.pdf
強化学習強化学習とは環境報酬エージェントの方策動的計画法行動価値関数予測問題と制御問題モンテカルロ法「ソフトコンピューティング」(後半) 北海道大学大学院情報科学研究科山下裕 2009 年後期 TD(0) 学習 Sarsa Q 学習 AC 手法 TD(λ) 法 Sarsa(λ) 法 SVM 強化学習ソフトコンピューティング 2009 年後期 – 1 / 42 ソフトコンピューティング 2009 年後期 – 2 / 42 強化学習とは強化学習強化学習とは環境報酬エージェントの方策動的計画法行動価値関数予測問題と制御問題モンテカルロ法環境強化学習強化学習とは環境報酬エージェントの方策動的計画法行動価値関数予測問題と制御問題モンテカルロ法強化学習 (Reinforcement Learning) とは: あ
suu-g 2010/01/20
モンテカルロ, Sarsa, Q学習

強化学習
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx