momosumのブックマーク - はてなブックマーク

momosum id:momosum

ブックマーク / www.slideshare.net/tadahirotaniguchi0624 (1)

人工知能概論 1
DeepMind論文(2016/6) 「Unifying Count-Based Exploration and Intrinsic Motivation 」記載のPseudo-count を用い、Deep Reinforcement Learningでの最難関ゲームであるMontezuma's Revengeを評価。Pseudo-countに加え、報告者の独自機能OHL(On-Hightscore-Learning)を含めて評価したところ、DeepMindの論文を超える探索範囲拡大に成功しました。また、OpenAI Gymで1位を獲得し(2016/10/13～2017/3/17)、サンフランシスコにあるOpenAIの招待を受け、説明に行ってきました。ブログ(http://itsukara.hateblo.jp/)に状況を逐次報告しています。 (注) 実験データ掲載用HTTPサーバを変更
momosum 2023/04/10
AI
リンク
1

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx