逆強化学習GAILの概要イメージ - Qiita

テクノロジーカテゴリーの変更を依頼記事元:

qiita.com/qiita_kuru

1user がブックマークコメント

コメント

1

記事へのコメント1件

注目コメント
新着コメント

新着コメントはまだありません。
このエントリーにコメントしてみましょう。

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

逆強化学習GAILの概要イメージ - Qiita

この記事について逆強化学習に分類される手法の一つであるGAIL (Generative Adversarial Imitation Lea... この記事について逆強化学習に分類される手法の一つであるGAIL (Generative Adversarial Imitation Learning)のイメージをまとめます。図解推定したいもの方策関数$\pi(a|s)$は、状態$S(t)=s$において行動$A(s)=a$を起こす確率を表す関数です推定したい物は、初期状態$S_{0}$から目指すべき状態$S_{t}$へ期待通り遷移できるように調整された$\pi(a|s)$です $\pi(a|s)$は基本的には初等関数のような簡単な関数とはならず推定が困難なため、ディープラーニングで関数を近似します学習で求めるモデル $S(t)$は、システムがセンサにより把握する現在の環境状態に相当します（e.g. 障害物までの距離等） $A(s)$は、システムに対して出す制御指示に相当します（e.g. ハンドル制御角度等）制御の結果、システム

機械学習

ブックマークしたユーザー

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

いま人気の記事 - 企業メディア

企業メディアをもっと読む

設定を変更しましたx