[B! 逆強化学習] hsato2011のブックマーク

hsato2011 id:hsato2011

逆強化学習に関するhsato2011のブックマーク (2)

TensorFlowで逆強化学習
TensorFlow 勉強会 (4) の発表資料です。途中の動画を見るには↓の元ファイルを御覧ください。 https://docs.google.com/presentation/d/1CWHjeiDJovG4ymuaoGCFLiBcSHNuNccMQQYkoFtpHxc/pub?start=false&loop=false&delayms=3000Read less
hsato2011 2017/04/17
逆強化学習

TensorFlow

機械学習
リンク
Apprenticeship Learning via Inverse Reinforcement Learning
中川研機械学習勉強会 2007/6/7 Apprenticeship Learning via Inverse Reinforcement Learning by Pieter Abbeel and Andrew Y. Ng (ICML 2004) 吉田稔強化学習 Reinforcement Learning • 環境と、そこで行動するエージェントがいるとき、「エージェントがどのような行動をとればいいか」を学習する。 – 「状態」と、それを遷移させる「行動」がある。 – Policy（方策、行動則）: 「状態」に応じた「行動」を決める。 – Reward function（報酬関数）：状態が望ましいか否かをスコア付けする。 – Value function（価値関数）：その状態から、最終的に望ましい結果になるかどうかをスコア付けする • 現時点の状態のみならず、将来
hsato2011 2016/11/22
江藤さんおすすめスライド

機械学習

強化学習

逆強化学習
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx