sionn_8のブックマーク - はてなブックマーク

sionn_8 id:sionn_8

ブックマーク / yagami12.hatenablog.com (1)

強化学習 - 星の本棚
機械学習の一種である強化学習について勉強したことをまとめたノート（忘備録）です。尚、ここで取り上げている各種強化学習手法の一部の手法の実装コードは、以下のレポジトリに保管してあります。 github.com 目次 [Contents] 強化学習のモデル化エージェントと環境の相互作用環境のマルコフ性エピソード的タスクと連続タスクマルコフ決定過程（MDP）価値関数状態価値関数行動価値関数状態価値関数と行動価値関数の関係ベルマン方程式ベルマン最適方程式とグリーディーな選択代表的な古典的強化学習手法の比較強化学習における動的計画法（DP法）反復法による近似解方策評価反復方策評価方策改善方策改善定理方策改善定理とグリーディー方策方策改善のアルゴリズム方策反復法 [policy iteration] 価値反復法 [value iteration] 一般化方策反
sionn_8 2022/05/18
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx