Q学習-最良経路を学習するスクリプト書いた (powered by Python) - Stargazing && Temporary Escapism ~インプット馬鹿への道~

テクノロジーカテゴリーの変更を依頼記事元:

kshi-kshi.hatenadiary.org

11 usersがブックマークコメント

コメント

0

記事へのコメント0件

注目コメント
新着コメント

新着コメントはまだありません。
このエントリーにコメントしてみましょう。

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

Q学習-最良経路を学習するスクリプト書いた (powered by Python) - Stargazing && Temporary Escapism ~インプット馬鹿への道~

概要講義の課題でQ学習について実装してみたので、スクリプト等を晒してみる. # # # # # # # # S 0 0 -... 概要講義の課題でQ学習について実装してみたので、スクリプト等を晒してみる. # # # # # # # # S 0 0 -10 0 # # 0 -10 0 0 0 # # 0 -10 0 -10 0 # # 0 0 0 -10 0 # # 0 -10 0 0 100 # # # # # # # #こんな感じの迷路において、S(start地点)からより良い報酬("100")までの経路をQ学習を用いて学習させるという話. Q学習-概要 Q学習（-がくしゅう、英: Q-learning）は、機械学習分野における強化学習の一種である。Q学習は機械学習手法の方策オフ型TD学習の一つである。Q学習は有限マルコフ決定過程において全ての状態が十分にサンプリングできるようなエピソードを無限回試行した場合、最適な評価値に収束することが理論的に証明されている。実際の問題に対してこの条件を満たすことは困難ではあ

ブックマークしたユーザー

pidekazu2018/08/29
marubontan2017/01/25
morioka2016/02/07
ariteku2014/06/23
satojkovic2014/02/22
kyopeco2013/06/03

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx