強化学習について学んでみた。（まとめ） - いものやま。

テクノロジーカテゴリーの変更を依頼記事元:

yamaimo.hatenablog.jp

16 usersがブックマークコメント

コメント

1

記事へのコメント1件

注目コメント
新着コメント

hatakazu93 技術

2016/11/16 リンク

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

強化学習について学んでみた。（まとめ） - いものやま。

ということで、長く続いてきたけど、これでオシマイ。これまでの各記事は、以下から。強化学習とは？ ... ということで、長く続いてきたけど、これでオシマイ。これまでの各記事は、以下から。強化学習とは？イントロダクション強化学習のコンセプト基本的な用語の定義「知識利用」と「探査」のバランスの問題非連想的な問題、n本腕バンディット問題 n本腕バンディット問題（プログラム）行動価値の推定と改善 n本腕バンディット問題 - εグリーディ法（プログラム） n本腕バンディット問題 - ソフトマックス法（プログラム）強化学習問題の数学的記述状態遷移のモデル、価値ベクトル、Bellman方程式動的計画法方策評価方策改善レンタカー問題 - 方策反復（プログラム）レンタカー問題 - 価値反復（プログラム）モンテカルロ法モンテカルロ法の考え方、モンテカルロ-ES法ブラックジャック - モンテカルロ-ES法（プログラム）方策オン型/オフ型モンテカルロ制御レーストラック問題 -

ブックマークしたユーザー

kenmatsu42018/12/25
y0341122018/12/25
ttsurumi2017/10/23
tsu-nera2017/06/13
Marukosu2017/05/21
somemo2017/05/17
azma0_02017/03/25
kwy2017/01/21
cvyan2016/11/16
wasoi2016/11/16
hatakazu932016/11/16
iphoneapprec2016/05/25
yukimori_7262016/05/25

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx