【2020年アップデート版】 強化学習では,環境で得られる報酬がスパースである場合,うまく学習することができない.この問題を解決するための手法として,強化学習のエージェントに「好奇心」を与える研究が注目されている.本スライドでは,深層強化学習の登場以降に発表された「好奇心」を利用した強化学習の研究をまとめた.特に主要ベンチマークであるMontezuma's Revengeで高いパフォーマンスを発揮したアルゴリズムについて詳しく解説する.また,「好奇心」による探索を報酬がスパースな場合以外の強化学習に適用した場合の最新研究についても紹介する. 現在は,本資料の修正・アップデート版を以下で公開しています. 【強化学習における好奇心】 https://www.slideshare.net/ShotaImai3/curiosity-reinforcement-learning-238344056
![強化学習における好奇心](https://cdn-ak-scissors.b.st-hatena.com/image/square/a0f35d1890f19173d08c65cd0faecab8d2fc06e6/height=288;version=1;width=512/https%3A%2F%2Ffiles.speakerdeck.com%2Fpresentations%2Fc3638bf0003b433b9d50a2c9104bc28f%2Fslide_0.jpg%3F16637751)