「Omost」は大規模言語モデル(LLM)のコーディング能力を画像生成に変換するオープンソースプロジェクトです。ControlNetやStable Diffusion WebUI Forge、Foocusの開発者として著名なlllyasviel氏が中心に開発しています。 そもそも「Omostって何」という方は前回の記事をご参照ください。 ✨️本記事は Nobuyuki Kobayashi @nyaa_toraneko さんにご寄稿いただいた記事をベースに編集部でリライトしております。 Omostが生成するCanvasとはCanvasは生成される画像に描かれるべき要素やモチーフを定義したオブジェクトです。 その構造は、大きく分けて2つのブロックから構成されています。 1.グローバル描写まずは、シーン全体のテーマや雰囲気を設定するブロックです。これをグローバル描写と呼びます。グローバル描写では