2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第5回目は、オーディオドラマを自動生成するAI技術など、5つの論文をまとめました。 生成AI論文ピックアップテキストから音声合成による“ラジオドラマ”を生成するAI「WavJourney」 画像間のフレームを滑らかに埋める技術 動画生成AIに役立つ可能性 使いやすい画像セグメンテーション用ライブラリ「Keras」 既存の画像生成AIを強化する「LLM-grounded Diffusion」 複数回の対話での生成、多言語生成が可能に ビデオ内の動く物体をマスク分割して高品質に追跡するシステム「HQTrack」 テキストから音声合成による“ラジオドラマ”を生成するAI「W