hsato2011のブックマーク - はてなブックマーク

hsato2011 id:hsato2011

ブックマーク / www.slideshare.net/tadahirotaniguchi0624 (1)

人工知能概論 1
DeepMind論文(2016/6) 「Unifying Count-Based Exploration and Intrinsic Motivation 」記載のPseudo-count を用い、Deep Reinforcement Learningでの最難関ゲームであるMontezuma's Revengeを評価。Pseudo-countに加え、報告者の独自機能OHL(On-Hightscore-Learning)を含めて評価したところ、DeepMindの論文を超える探索範囲拡大に成功しました。また、OpenAI Gymで1位を獲得し(2016/10/13～2017/3/17)、サンフランシスコにあるOpenAIの招待を受け、説明に行ってきました。ブログ(http://itsukara.hateblo.jp/)に状況を逐次報告しています。 (注) 実験データ掲載用HTTPサーバを変更
hsato2011 2016/10/17
あとで読む

人工知能

ホイール

チューリング

フレーム

チューリングテスト

*あとで読む
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx