タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

*algorithmと*programとengineに関するsh19910711のブックマーク (2)

  • 自作シンプル物理演算ゲームを強化学習で攻略させる【Unity ML-Agents v3.0】 - Qiita

    自作シンプル物理演算ゲームを強化学習で攻略させる【Unity ML-Agents v3.0】 以前から機械学習などに興味があったものの、難しそうでためらっていたのですが、Unityで強化学習ができるML-Agentsというものがあると知り、理論についてほぼ何も知識のない自分でも、なんだかいけそうだと思って試してみました。 まずは公式サンプルゲームを動かしてみたのですが、何か自作ゲームを学習させてみないと理解が進まないと思い、なるべくシンプルで最小限の構成になるようなゲームを考えました。そして、せっかくUnityを使うので物理演算も入れたい。 そこで考えたのが、上から降ってくる物体をヘディングのようにバウンドさせるゲームです。人間が手動でプレイするとこんな感じになります。これを強化学習させて攻略させてみました。 これ以下の内容はML-Agentsの公式サンプルを動かすところまで出来る方が対象

    自作シンプル物理演算ゲームを強化学習で攻略させる【Unity ML-Agents v3.0】 - Qiita
  • オートエンコーダを使って強化学習してみた - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? オートエンコーダ:抽象的な特徴を自己学習するディープラーニングの人気者 Unity ML-Agentsで、カメラから得た画像をオートエンコーダで次元圧縮し、強化学習してみました。 なぜオートエンコーダを使うのかを説明する前に、まず基的な強化学習の形とその問題点について解説します。 基的な強化学習の形とその問題点 強化学習の目的は、ある環境において、ある状態 s のとき最適な行動 a をとる方策 π(a|s) を見つけることです。 強化学習入門 Part2 - TensorflowとKerasとOpenAI GymでPolicy Gr

    オートエンコーダを使って強化学習してみた - Qiita
    sh19910711
    sh19910711 2019/06/11
    "強化学習: ある状態 s のとき最適な行動 a をとる方策 π(a|s) を見つける / 状態 s が連続値になれば、方策 π を上のような表で表現することはできないので、何かしらの関数近似器を使って近似する必要"
  • 1