タグ

ブックマーク / yagami12.hatenablog.com (2)

  • 強化学習 - 星の本棚

    機械学習の一種である強化学習について勉強したことをまとめたノート(忘備録)です。 尚、ここで取り上げている各種強化学習手法の一部の手法の実装コードは、以下のレポジトリに保管してあります。 github.com 目次 [Contents] 強化学習のモデル化 エージェントと環境の相互作用 環境のマルコフ性 エピソード的タスクと連続タスク マルコフ決定過程(MDP) 価値関数 状態価値関数 行動価値関数 状態価値関数と行動価値関数の関係 ベルマン方程式 ベルマン最適方程式とグリーディーな選択 代表的な古典的強化学習手法の比較 強化学習における動的計画法(DP法) 反復法による近似解 方策評価 反復方策評価 方策改善 方策改善定理 方策改善定理とグリーディー方策 方策改善のアルゴリズム 方策反復法 [policy iteration] 価値反復法 [value iteration] 一般化方策反

    強化学習 - 星の本棚
  • カーネル法 - 星の本棚

    非線形データに対する多変数解析の一種であるカーネル法の、主に数理面について勉強したことをまとめたノート(忘備録)です。 目次 [Contents] 概要 特徴写像と再生核ヒルベルト空間 カーネルトリック リプレゼンター定理 カーネル法を利用した各種データ解析手法に共通する手順 正定値カーネル 実数の正定値カーネル 複素数の正定値カーネル 正定値カーネルの基的な性質 関数の内積で表現される正定値カーネル 正定値カーネルの例 線形カーネル(=通常のユークリッド空間上での内積) 指数型カーネル 動径基底関数カーネル(RBFカーネル)[radial bases function kernel] ラプラスカーネル 多項式カーネル 再生核ヒルベルト空間 再生核の性質 再生核のテンソル積 再生核ヒルベルト空間の線形汎関数を用いた特徴付けとリースの表現定理 Moore-Aronszajn の定理 特徴写

    カーネル法 - 星の本棚
    agw
    agw 2018/12/04
  • 1