エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
オートエンコーダを使って強化学習してみた - Qiita
記事へのコメント1件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
オートエンコーダを使って強化学習してみた - Qiita
オートエンコーダ:抽象的な特徴を自己学習するディープラーニングの人気者 Unity ML-Agentsで、カメラ... オートエンコーダ:抽象的な特徴を自己学習するディープラーニングの人気者 Unity ML-Agentsで、カメラから得た画像をオートエンコーダで次元圧縮し、強化学習してみました。 なぜオートエンコーダを使うのかを説明する前に、まず基本的な強化学習の形とその問題点について解説します。 基本的な強化学習の形とその問題点 強化学習の目的は、ある環境において、ある状態 s のとき最適な行動 a をとる方策 π(a|s) を見つけることです。 強化学習入門 Part2 - TensorflowとKerasとOpenAI GymでPolicy Gradientを実装してみよう! 状態sが 0,1,2,3,... のように離散値であれば、状態・行動の表を作って方策 π を表現することができます。 DQNをKerasとTensorFlowとOpenAI Gymで実装する しかし、状態 s が連続値になれば