1月の初めごろ、 DeepMind から DreamerV3 という強化学習アルゴリズムが発表されました。このアルゴリズムは、極めて難しいタスクとして知られる Minecraft のダイヤモンド収集タスクをゼロから解くことができたとして話題になりました。これは汎用的なアルゴリズムとしては初めての結果で特筆に値するものです。 そこで、本記事では DreamerV3 を提案した論文 "Mastering Diverse Domains through World Models (Hanfer et al., 2023)" について解説していきます。その際、その元になっている Dreamer (Hanfer et al., 2019)、DreamerV2 (Hanfer et al., 2020) などもおさらいしていきます。 文責:高木志郎 ステート・オブ・AI ガイドでは、人工知能・機械学習