agwのブックマーク - はてなブックマーク

強化学習 - 星の本棚
機械学習の一種である強化学習について勉強したことをまとめたノート（忘備録）です。尚、ここで取り上げている各種強化学習手法の一部の手法の実装コードは、以下のレポジトリに保管してあります。 github.com 目次 [Contents] 強化学習のモデル化エージェントと環境の相互作用環境のマルコフ性エピソード的タスクと連続タスクマルコフ決定過程（MDP）価値関数状態価値関数行動価値関数状態価値関数と行動価値関数の関係ベルマン方程式ベルマン最適方程式とグリーディーな選択代表的な古典的強化学習手法の比較強化学習における動的計画法（DP法）反復法による近似解方策評価反復方策評価方策改善方策改善定理方策改善定理とグリーディー方策方策改善のアルゴリズム方策反復法 [policy iteration] 価値反復法 [value iteration] 一般化方策反
agw 2022/05/18
deferred

ML

AI
リンク
カーネル法 - 星の本棚
非線形データに対する多変数解析の一種であるカーネル法の、主に数理面について勉強したことをまとめたノート（忘備録）です。目次 [Contents] 概要特徴写像と再生核ヒルベルト空間カーネルトリックリプレゼンター定理カーネル法を利用した各種データ解析手法に共通する手順正定値カーネル実数の正定値カーネル複素数の正定値カーネル正定値カーネルの基本的な性質関数の内積で表現される正定値カーネル正定値カーネルの例線形カーネル（＝通常のユークリッド空間上での内積）指数型カーネル動径基底関数カーネル（RBFカーネル）[radial bases function kernel] ラプラスカーネル多項式カーネル再生核ヒルベルト空間再生核の性質再生核のテンソル積再生核ヒルベルト空間の線形汎関数を用いた特徴付けとリースの表現定理 Moore-Aronszajn の定理特徴写
agw 2018/12/04
リンク
1

はてなブックマーク

タグ

ブックマーク / yagami12.hatenablog.com (2)

お知らせ

月間はてなブックマーク数ランキング（2024年8月）

今週のはてなブックマーク数ランキング（2024年9月第1週）

今週のはてなブックマーク数ランキング（2024年8月第4週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

タグ

ブックマーク / yagami12.hatenablog.com (2)

強化学習 - 星の本棚

カーネル法 - 星の本棚

お知らせ

月間はてなブックマーク数ランキング（2024年8月）

今週のはてなブックマーク数ランキング（2024年9月第1週）

今週のはてなブックマーク数ランキング（2024年8月第4週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス