Googleが複数の入力画像をベースに新しい画像を生成できる画像生成AIの「Whisk」を、日本を含む100カ国以上で利用可能にしています。Whiskは入力画像をGeminiでキャプションに変換し、これをGoogleの画像生成モデルであるImagen 3で画像に変換しているとのことで、実際にどんな画像が生成できるのか気になったので使って確かめてみました。 Whisk - labs.google/fx https://labs.google/fx/tools/whisk 上記URLにアクセスして「SIGN IN WITH GOOGLE」をクリック。 「次へ」をクリック。 Googleのプライバシーポリシーを確認したら、「次へ」をクリック。 利用規約への同意を求められるので「同意して続行」をクリック。 Whiskでは写真をプロンプトとして使用することで、新しい画像を生成することができます。画像
![Googleが複数画像をミックスして新しいイメージを生み出す画像生成AI「Whisk」を日本含む100カ国以上で利用可能に、モデル・背景・スタイルの3つを画像orテキストで入力するとImagen 3がフュージョンしてくれる](https://cdn-ak-scissors.b.st-hatena.com/image/square/8e5d67ae786d1abacff532ea5260e05815532c76/height=288;version=1;width=512/https%3A%2F%2Fi.gzn.jp%2Fimg%2F2025%2F02%2F13%2Fgoogle-whisk%2F00.jpg)