azma0_0のブックマーク / 2017年3月25日

強化学習について学んでみた。（まとめ） - いものやま。

ということで、長く続いてきたけど、これでオシマイ。これまでの各記事は、以下から。強化学習とは？イントロダクション強化学習のコンセプト基本的な用語の定義「知識利用」と「探査」のバランスの問題非連想的な問題、n本腕バンディット問題 n本腕バンディット問題（プログラム）行動価値の推定と改善 n本腕バンディット問題 - εグリーディ法（プログラム） n本腕バンディット問題 - ソフトマックス法（プログラム）強化学習問題の数学的記述状態遷移のモデル、価値ベクトル、Bellman方程式動的計画法方策評価方策改善レンタカー問題 - 方策反復（プログラム）レンタカー問題 - 価値反復（プログラム）モンテカルロ法モンテカルロ法の考え方、モンテカルロ-ES法ブラックジャック - モンテカルロ-ES法（プログラム）方策オン型/オフ型モンテカルロ制御レーストラック問題 -

はてなブックマーク

タグ

2017年3月25日のブックマーク (1件)

強化学習について学んでみた。（まとめ） - いものやま。

お知らせ

今週のはてなブックマーク数ランキング（2024年8月第2週）

今週のはてなブックマーク数ランキング（2024年8月第1週）

月間はてなブックマーク数ランキング（2024年7月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス