saharamakotoのブックマーク / 2022年10月14日

Sota at Token 2049 - The future of Smart Contracts

saharamakoto 2022/10/14

わくわく♪

リンク

グーグル、短い「音」から続きを生成するオーディオAI

グーグルの新しい技術「オーディオLM（AudioLM）」は、人間が準備したテキストやラベル付けをした訓練データなしに、これまで以上に自然なオーディオを生成する。 by Tammy Xu2022.10.14 23 8 グーグルの研究チームが開発した新しい人工知能（AI）システムは、数秒間の録音データを与えるだけで、それに続く自然なスピーチや音楽を作ることができる。「オーディオLM（AudioLM）」は、ピアノ曲のような複雑な音や人間の音声など、プロンプトのスタイルに合ったオーディオを、元の録音データとほとんど遜色ないレベルで生成する技術だ。オーディオ生成AIの訓練プロセスを高速化する可能性がある技術であり、いずれは映像に乗せて流す音楽の自動生成にもつながるかもしれない。自然言語処理を利用した音声アシスタントのアレクサ（Alexa）に代表されるように、AIによって生成されたオーディオはすで