並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 1 件 / 1件

新着順 人気順

全く新しいの検索結果1 - 1 件 / 1件

  • 【強化学習】全く新しい手法で最難関ゲームMontezuma's Revengeを攻略したGo-Exploreを解説・(実装) - Qiita

    【強化学習】全く新しい手法で最難関ゲームMontezuma's Revengeを攻略したGo-Exploreを解説・(実装)Python機械学習強化学習SImpleDistributedRL この記事は自作している強化学習フレームワークの解説記事です。 はじめに ふと以下のAtariゲームのベンチマークを見ていたら Montezuma's Revenge でかなり高いスコアを出していたGo-Exploreというアルゴリズムがあったので見てみました。 https://paperswithcode.com/task/atari-games Go-Explore論文 ・https://arxiv.org/abs/1901.10995 ・https://arxiv.org/abs/2004.12919 背景が分かりませんがなぜか2種類あります。2020年頃の論文ですね。 ちなみにこの論文は概念的な

      【強化学習】全く新しい手法で最難関ゲームMontezuma's Revengeを攻略したGo-Exploreを解説・(実装) - Qiita
    1