現在のAIブームのきっかけは、画像生成AIがブレークしたことだ。 あまりにもリアルで人間が描いたものを凌駕するような絵画をAIが描いたことで話題を呼んだ。今では様々な画像生成AIが登場しているが、その中心は「Stable Diffusion」という画像生成AIだ。複数の研究者によって開発され、Stability AIという会社が提供したものだが、そのStability AIが今度は「Stable Audio」という音楽生成AIを発表した。つまり話題の画像生成AIの大手が手がけた音楽生成AIということになる。 1万9500時間以上の音楽データから学習した音楽生成AI Stable Audioは、グーグルの「MusicLM」やメタの「MusicGen」のように、プロンプト(指示文)に基づいて音楽を作り出す本格的な生成AIだ。Diffusionは拡散モデルを意味し、浮き上がるようなステップを経て
![音楽生成AI「Stable Audio」を試すが、道はまだまだ長そうだ (1/2)](https://cdn-ak-scissors.b.st-hatena.com/image/square/e4c804fcc445d8e0ce0e2f38ffac40a4a1e54409/height=288;version=1;width=512/https%3A%2F%2Fascii.jp%2Fimg%2F2023%2F10%2F15%2F3621718%2Fxl%2Ffc18bd332555c63a.jpg%3F20200122)