思考の引き出しを増やすモジュール設計のヒント
![Terraform Module Designs](https://cdn-ak-scissors.b.st-hatena.com/image/square/fbb9e741559d41a62548113a0492f41534634152/height=288;version=1;width=512/https%3A%2F%2Ffiles.speakerdeck.com%2Fpresentations%2Fba0d8c6b4ecf47b0877998580d00f51b%2Fslide_0.jpg%3F22498326)
追記:簡単に動かせるNotebook作りました より簡単に動かせるColab Notebookを作っています。Hugging Faceのアクセストークンさえあれば、手軽にWebアプリ感覚で使えます。以下GitHubリポジトリのリンクからどうぞ。 解説ブログは以下です。 Stable DiffusionをGoogle Colabで動かす Stable Diffusion大人気ですね。公式が提供しているGoogle Colabノートブックで手軽に楽しむこともできます。 GitHubのStable Diffusionの公式のリポジトリを見ると、テキストから画像を生成するtext2img.pyの他ににも、画像からテキストの指示をもとに画像を生成(変換)するimg2img.pyなど色々なスクリプトがあります。 というわけで、これらのスクリプトをローカルPC無しでも自由自在に動かせるようなGoogle
promptに何をすればいい? midjourneyやStable Diffusionである画像生成AIのキーワードの生成フォームです。チェックボックスを選んでGenerateボタンをクリックすると、Promptにコピペできる呪文を生成します。便利に使ってください。 プロンプトをカンマで区切る ON テンプレ呪文 人の顔など、すぐに作れない要素を詰め合わせたテンプレート呪文です。 なし 人の顔再現(human face head hair forehead temple face nose cheek mouth lips ear jaw smile) 人の全身(human face head hair forehead temple face eye eyebrow eyelash eyelid eyeball iris cornea nose cheek mouth lips ear
巷で話題のStable Diffusion(以下SD)をファインチューニングする方法が公開されたので、早速やります。
TL;DR Stable Diffusion でプロンプトに重みをつけたり、意味の世界で足したり引いたりするよ 例: ピラミッド - エジプト + 日本 = ? 画風をシームレスに変換できるよ seed 変更だと大きく変わってしまうけど、小さい重みで補正かければ構図を維持したまま絵に微調整を加えられるよ 意味の足し算・引き算 Stable Diffusion では、内部的に以下の 2 ステップの処理を行うことでテキストを画像に変換している テキストをベクトル(数の組)に変換する ベクトルを画像に変換する ところで、以下の動画を見てほしい テキストをベクトルにすることで、意味の世界で足し算や引き算が実現できている。 これを Stable Diffusion に応用したらどうなるだろうか[1]。 以下では、プロンプトの計算ができるように機能追加したStable Diffusionを用いる。 機
Stable Diffusionの衝撃 つい先週「Midjourney」というAIによる画像生成AIを紹介しましたが、Stable Diffusionという超新星が登場いたしました。 何が凄いかというと、オープンにモデルが公開されているので、誰でもこのモデルを改変したり、モデルを使用したアプリが作れるのです。詳しくは、以下の深津さんのnote記事を参照ください。 さすらいAIプログラマーのshi3zさんは、既に日本語で誰でも無料で手軽に使えるWebアプリを公開されています。 サーバー代めちゃくちゃかかっているけど、自腹でやり続けるそうです。凄すぎです。上記記事のshi3zさんのYouTube動画から、shi3zさんの熱狂が伝わってきます。 Stable DiffusionをWebアプリ的に手軽に使えるツールを作成しました。 思えば、私もディープラーニングおじさんも、AIにハマった大きなきっ
ビジュアル的によく知られた物を指示してください 例. Wizard, priest, angel, emperor, necromancer, rockstar, city, queen, Zeus, house, temple, farm, car, landscape, mountain, river など 強いフィーリングや神秘的な響きのする言葉は良い結果を生みやすい “a sense of awe” “the will to endure” “cognitive resonance” “the shores of infinity” “the birth of time” “a desire for knowledge” “the notion of self”など 画風(style)を決めてみてください 例. “a cyberpunk wizard” “a surreal lan
昨日の続き。 jtnoske.hateblo.jp やはり構図を決めるにはimg2imgや、と思い立つ promptとキャンバス縦横比とかで構図のコントロールに挑戦したけど、いやこりゃ無理だわやっぱ構図を自分で決めるならimg2imgでいろいろ指定してやらないといかんのだろな、ということでimg2imgを導入する。 導入 導入方法は各所で上がっていますが、自分は↓のコードをコピペして、 github.com ↓ のコードを参考に実行をしました。 www.12-technology.com Hな方々は↓を(トラバ含めて)参照し、safety_checkerを切りましょう。変更箇所はStableDiffusionPipelineとほとんど同じです。 anond.hatelabo.jp 絵が描けないので img2img(1): 全身立ち絵 絵を用意しよう、なんだけどどう用意するか。 まず思いつい
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く