【強化学習】全く新しい手法で最難関ゲームMontezuma's Revengeを攻略したGo-Exploreを解説・(実装)Python機械学習強化学習SImpleDistributedRL この記事は自作している強化学習フレームワークの解説記事です。 はじめに ふと以下のAtariゲームのベンチマークを見ていたら Montezuma's Revenge でかなり高いスコアを出していたGo-Exploreというアルゴリズムがあったので見てみました。 https://paperswithcode.com/task/atari-games Go-Explore論文 ・https://arxiv.org/abs/1901.10995 ・https://arxiv.org/abs/2004.12919 背景が分かりませんがなぜか2種類あります。2020年頃の論文ですね。 ちなみにこの論文は概念的な