はじめに こんにちは、東京大学松尾研究室B4の大庭弘己です。 今日の記事では、画像生成などで巷を騒がせたdiffusion modelを用いてモーションを生成する手法を提案した論文であるMDM:Human Motion Diffusion Modelを紹介します。 概要 Human Motion Diffusion Model(以下MDM)は、任意のテキストからモーションを生成する手法です。論文内では自由に叙述したテキストからのモーション生成、アクションのラベル(走る、蹴るなど)からのモーションの生成、モーションの編集の主に三つの機能が紹介されていますが、この記事ではテキストからのモーション生成について詳しくまとめようと思います。 "A person punches in a manner consistent with martial arts"の生成結果(公式プロジェクトページより引用