2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第8回目は、マイクロソフトによるText-to-Speech技術、3Dシーンやアバター生成技術など、5つの論文をまとめました。 生成AI論文ピックアップ任意の人の声でテキストを読ませるText-to-Speechモデル「SpeechX」 米Microsoftの研究者らが開発 映像から3Dシーンを生成できるVideo-to-3Dモデル「Neuralangelo」のコードが公開 安定したビデオ合成ができる動画処理技術「CoDeF」 中国の研究者らが開発 写真1枚から着衣3D人体モデルを高精度に生成する技術「TeCH」 ユーザー特化のAIチャットボットが作れるアプローチ G