モデルフリー系の深層強化学習の手法を用いてスマブラDXのゲームAIを作ったという論文が出ていたので読んだ。以下はそのメモ。 概要 論文URL : https://arxiv.org/abs/1702.06230 著者のグループは github でコードを公開しており、そのデモ動画が twitch や youtube に上がっている。 www.youtube.com 上の動画はその一例。明記されていないが、動きからして 2P のキャプテン・ファルコンが強化学習 AI で、1P が人間だと思われる。スマブラの素人が見てもあまりピンと来ないのだが、人間側は世界ランキングでトップ50相当のプレイヤー(二人いて、途中で交代している)らしい。 reddit や hacker news でも活発に議論されている模様。 内容 環境の定義について Atari のゲーム環境などとは異なり、画像ではなくエミュレ