記事へのコメント2

    • 注目コメント
    • 新着コメント
    sh19910711
    sh19910711 2016 / "「良い」を定量的に定義できれば強化学習を用いて「良い」状態に導くことができる / 現実には「良い」を定量的に定義することが難しい場面も多い / IRL: エキスパートの行動をもとに、どの状態がどれくらい「良い

    2022/04/18 リンク

    その他
    zyxwv
    zyxwv 強化学習:最適の定義→最適な行動。逆強化学習:最適な行動→最適の定義。どんな報酬で動いているかわからないシステムの動作から、報酬を推定する。

    2018/03/21 リンク

    その他

    注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

    アプリのスクリーンショット
    いまの話題をアプリでチェック!
    • バナー広告なし
    • ミュート機能あり
    • ダークモード搭載
    アプリをダウンロード

    関連記事

    TensorFlowで逆強化学習

    TensorFlow 勉強会 (4) の発表資料です。 途中の動画を見るには↓の元ファイルを御覧ください。 https://...

    ブックマークしたユーザー

    • sh199107112022/04/18 sh19910711
    • zyxwv2018/03/21 zyxwv
    • Kureduki_Maari2018/01/10 Kureduki_Maari
    • pandazx2017/08/31 pandazx
    • hsato20112017/04/17 hsato2011
    • yue822016/11/16 yue82
    • kiyukuta2016/08/21 kiyukuta
    • theflyingcat282016/08/10 theflyingcat28
    • riyokotter2016/07/19 riyokotter
    • lanius2016/07/19 lanius
    • Nyoho2016/07/18 Nyoho
    • yukimori_7262016/07/17 yukimori_726
    すべてのユーザーの
    詳細を表示します

    いま人気の記事

    いま人気の記事をもっと読む

    いま人気の記事 - テクノロジー

    いま人気の記事 - テクノロジーをもっと読む

    新着記事 - テクノロジー

    新着記事 - テクノロジーをもっと読む

    同時期にブックマークされた記事