まず、妻の写真を学習したStable Diffusionから、絵を生成します。プロンプトは、「a photographic portrait of Torichan girl looking up at starry sky」とかなんとか。 これを、マルチモーダル化したChatGPT(GPT-4V)に読み込ませ、「この写真を見て思いついた歌詞を書いてみて」と頼みました。 作詞してくれたのは、これ。そうか君は宇宙と書いて「そら」と読む派閥か(「うみ」ではなく)。 星埋める夜に願いを込めて 手を伸ばし掴む、遠い光 夢の続きを、この手で描こう 無限の宇宙(そら)、私だけの物語 次にこの歌詞を元に、 Sunoでさまざまなスタイルの曲を作ってもらいました。 出来上がったのは、どれも女性ボーカルの曲。16回生成し、それぞれ2曲ずつ作ってくれたので、合計32曲の中から一番良かったものをピックアップ。歌詞
![AI作曲でマルチモーダル活用。Suno + ChatGPT + Stable Diffusionを連携させたらエモくなった(CloseBox) | テクノエッジ TechnoEdge](https://cdn-ak-scissors.b.st-hatena.com/image/square/3f5fcf7fc5d22e3de0077a12476aec0d4364eac0/height=288;version=1;width=512/https%3A%2F%2Fwww.techno-edge.net%2Fimgs%2Fogp_f%2F12309.png)