強化学習では「不確かなときには楽観的に」という原理があってそのほうがうまくいく。これはそのまま人生にも適用可能ではという指摘が示唆に富む。

stealthinustealthinu のブックマーク 2017/03/24 17:02

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

強化学習その1

    4. 今後の予定 第1回: 序章 1章 強化学習の基礎的理論 1節 強化学習とは 第2回: 2節 強化学習の構成要素 第3回: 3節 価値反復に基づくアルゴリズム 第4回: 4節 方策勾配に基づくアルゴリズム 第5回: 5節 部分観測...

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう