ジェイ・アラマールのブログより。 AIによる画像生成は、(私を含めて)人々の度肝をぬく最新のAIの能力です。テキストの説明から印象的なビジュアルを作り出す能力は、魔法のような品質を持ち、人間がアートを創造する方法の変化を明確に指し示しています。Stable Diffusionのリリースは、高性能(画質だけでなく、速度や比較的低いリソース/メモリ要件という意味での性能)なモデルを一般の人々に提供することになったのは、この開発における明確なマイルストーンです。 AI画像生成を試してみて、その仕組みが気になり始めた方も多いのではないでしょうか。 ここでは、Stable Diffusionの仕組みについて優しく紹介します。 Stable Diffusionは、様々な使い方ができる汎用性の高いものです。まず、テキストのみからの画像生成(text2img)に焦点を当てます。上の画像は、テキスト入力と生
![図解Stable Diffusion](https://cdn-ak-scissors.b.st-hatena.com/image/square/af03eb81df6dea15c372e2d2139132b1ec3b03b9/height=288;version=1;width=512/https%3A%2F%2Fblogger.googleusercontent.com%2Fimg%2Fb%2FR29vZ2xl%2FAVvXsEitXUQKrMUyPwKW92RwQIFyhk6RqAmCDQjWmwhNUio2PNLuZdD3dHkmohHpm0xvR1T2QKxuDxZMIxjXtaM0T0Uee-42Ax-KrEd4uxHklHgEhCr-tRHUKiheJJ9RvAZ6uX7EGYxdZImMxDfnq_lCgN6_9oGwjaHGAMcBbbZGOQ2cX0k9THJQwkwAFwVrMw%2Fw1200-h630-p-k-no-nu%2Fstable-diffusion-text-to-image.png)