はじめに 画像生成は知識のない人でも簡単に使えるツールとして SNS で流行しました。画像生成自体は GAN をはじめとして以前からありましたが、生成される画像は一般利用できるような制度ではありませんでした。 しかし、Transformer の登場と拡散モデルと呼ばれる手法により、画像と自然言語がより密接に関わるようになったことで stable-diffusion や DALL・E2 など非常に高品質な画像を生成するモデルが誕生しました。本記事では、この二つのモデル、stable-diffusion と DALL・E2 について紹介します。 stable-diffusion の概要 stable-diffusion は画像生成アルゴリズムの一種であり、自然言語からそのテーマに合った画像を生成することができます。 画像生成は以前まで GAN と呼ばれるモデルが主流でした。このモデルはバージョ

