この記事ではstable diffusion系を使った画像生成で出てくる ステップ数、CFG scale、サンプラー といったパラメータの数々について、 どう言う意味なのか噛み砕きながら紹介したいと思います。 画像生成AI呪文シリーズなるものを作っておりますが、 正直に言うと、パラメータの意味をよく知らずに画像生成AIを使っておりました。 逆に言うと、意味はよく分からなくても使えてしまいます。 もちろん、ステップ数は名前からして何となくイメージできますし、 CFG scaleもどれだけプロンプトに従うかを調整することは 見聞きしておりましたが、これらのパラメータが、 中で何をしているのかが気になったので、調べてまとめます。 画像生成のイメージ Latent Diffusion Model(LDM)とステップ数 条件付けはTransformer より効果的な条件付けを:CFG 分類器を使った
![今更聞けない画像生成AI: CFG scaleやサンプラーって何なの? - クイックノート](https://cdn-ak-scissors.b.st-hatena.com/image/square/9989f9e1624c7f26a9340e2d5dcb66582c1132b4/height=288;version=1;width=512/https%3A%2F%2Fcdn-ak.f.st-hatena.com%2Fimages%2Ffotolife%2Fu%2Fu874072e%2F20221129%2F20221129160104.png)