2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第36回目は、生成AI最新論文の概要5つを紹介します。 生成AI論文ピックアップ 透明画像含む複数のレイヤーをテキスト指示で同時に生成するAI「LayerDiffuse」 1枚の顔写真と音声から、喋って歌う頭部動画を生成するモデル「EMO」、アリババが開発 大規模言語モデルの計算コストを大幅に軽減する1ビットLLM「BitNet 1.58Bits」をマイクロソフトが開発 音楽をテキストのように扱い、音楽の理解と生成を行うAI「ChatMusician」 複数のLoRAを適応する画像合成法「Multi-LoRA」 透明画像含む複数のレイヤーをテキスト指示で同時に生成する