タグ

mainyaaのブックマーク (30,264)

  • 日刊 画像生成AI (2022年9月27日)|やまかず

    画像生成AI界は、今認識できないスピードで進化をし続けています。 DALL・E2公開、Midjourney公開、StableDiffusionがオープンソースで公開されて..進化の速度が上がり続けており、日々異常なスピードで変化しています。 "次々と立ち上がる可能性"そんな中、毎日時間なくて全然情報追えない..!って人のために業界変化、新表現、思考、問題、技術を毎日あらゆるメディアを調べ、まとめています。 いつも見てくださっている方ごめんなさい! しばらく2日間の時間差投稿になっててます。 昨日までの投稿はこちら 開発DreamBoothが一気にcolabで利用できるレベルに進化。DreamBoothは24GBのVRAM18GBのVRAMで実行可能になったと思ったら、12.5GB VRAMで動くように改良されました。つまり、Google Colabで動作するようになりました。(DreamB

    日刊 画像生成AI (2022年9月27日)|やまかず
    mainyaa
    mainyaa 2022/10/01
  • 画像生成AI「Stable Diffusion」でどれぐらいプロンプト・呪文の指示に従うかを決める「CFG(classifier-free guidance)」とは一体何なのか?

    入力したプロンプトを基に画像を生成するAI「Stable Diffusion」は一般公開以降、世界中の人々から注目を浴びており、さまざまなツールや応用方法も発表されています。そんなStable Diffusionで画像を生成する際の設定項目には、「画像生成でどれだけプロンプトに従うか」を決める「CFG(classifier-free guidance)スケール」という値があります。 CLASSIFIER-FREE DIFFUSION GUIDANCE.pdf https://arxiv.org/pdf/2207.12598.pdf 【論文解説】OpenAI 『GLIDE』を理解する | 楽しみながら理解するAI機械学習入門 https://data-analytics.fun/2022/02/13/openai-glide/#toc5 The Road to Realistic Full

    画像生成AI「Stable Diffusion」でどれぐらいプロンプト・呪文の指示に従うかを決める「CFG(classifier-free guidance)」とは一体何なのか?
    mainyaa
    mainyaa 2022/10/01
  • Stable Diffusion Dreambooth Concepts Library による DreamBoothの ファインチューニング|npaka

    2. 学習の実行DreamBooth学習用ノートブックでの学習の手順は、次のとおりです。 2.1 DreamBoothの学習用ノートブックを開く はじめに、DreamBoothの学習用ノートブックを開きます。 2.2. Initial setup次に、各種パッケージをインストールします。 (1) 「Install the request libs」のセルを実行。 パッケージがインストールします。 (2) 「Login to the Hugging Face Hub」のセルを実行。 HuggingFaceにログインします。リンク先のHuggingFaceのトークンをテキストボックスにコピペします。 (3) 「Import required library」のセルを実行。 パッケージをインポートします。 2.3 Settings for teaching your new concept次に、

    Stable Diffusion Dreambooth Concepts Library による DreamBoothの ファインチューニング|npaka
    mainyaa
    mainyaa 2022/10/01
  • 日刊 画像生成AI (2022年9月17日)|やまかず

    画像生成AI界は、今認識できないスピードで進化をし続けています。 DALL・E2公開、Midjourney公開、StableDiffusionがオープンソースで公開されて..進化の速度が上がり続けており、日々異常なスピードで変化しています。 "開放されたマルチバースへの扉"そんな中、毎日時間なくて全然情報追えない..!って人のために業界変化、新表現、思考、問題、技術を毎日あらゆるメディアを調べ、まとめています。 昨日までの投稿はこちら 開発Grokking SD 日語版tomo-makesさんが先週紹介したGrokking Stable DiffusionというStable Diffusionの仕組みをわかりやすくしたcolab notebookを日語訳されました。めちゃめちゃ最高です。 Stable Diffusionまるわかり! Colabノートブック Grokking SDという

    日刊 画像生成AI (2022年9月17日)|やまかず
    mainyaa
    mainyaa 2022/09/29
  • Stable Diffusionの内容を理解するための情報・書籍 - karaage. [からあげ]

    Stable Diffusion完全に理解した 画像生成AIで話題のStable Diffusion、完全に理解した状態になりたいですね。私もです。夜な夜な、Stable Diffusion睡眠不足になりながらの自分の理解は以下です。 Stable DiffusionというAIモデルは、上記のように、2つのモデルで構成されています。凄いのがDiffusion Modelとよばれるもので、これはランダムノイズ的な画像から、クオリティの高い絵を生成することができます。 ただ、このままだとどんな絵が生成されるか分からないので、絵をコントロールするために、プロンプト(自然言語)をCLIPと呼ばれるTransformerのモデルに入力して、埋め込みベクトルに変換します。このベクトル情報をDiffusion Modelに入れてやることで、自分の好きな画像を生成することができます。 無理やりカメラとの対

    Stable Diffusionの内容を理解するための情報・書籍 - karaage. [からあげ]
  • Midjourney、Stable Diffusion、mimicなどの画像自動生成AIと著作権(その2)|知的財産・IT・人工知能・ベンチャービジネスの法律相談なら【STORIA法律事務所】

    前回記事「Midjourney、Stable Diffusion、mimicなどの画像自動生成AIと著作権」は、おかげさまで沢山の方に読んで頂き、いろいろな意見や御質問や取材を頂きました。 それらの意見・御質問や取材を通じて、自分の中で新たな整理ができたので、続編の記事を書きたいと思います。 第1 どのような場合に著作権侵害になるのか みなさんの興味関心が強いトピックとして「画像自動生成AIを利用して画像を自動生成し、既存著作物の類似画像が生成された場合に著作権侵害に該当するか」があります。 前回の記事では「学習に用いられた画像と同一の画像が『偶然』自動生成された場合、著作権侵害に該当するか」について解説をしましたが、今回の記事では、もう少し多くのパターンについて検討をしたいと思います。 まず、その前提として「著作権侵害の要件」と「著作権侵害の効果」について説明をします。 この「要件」と「

    Midjourney、Stable Diffusion、mimicなどの画像自動生成AIと著作権(その2)|知的財産・IT・人工知能・ベンチャービジネスの法律相談なら【STORIA法律事務所】
    mainyaa
    mainyaa 2022/09/23
  • Stable Diffusionのプロンプトをチェックするテクニック

    Stable Diffusionのプロンプトの鉄の掟 Stable Diffusionのプロンプトは、CLIPと呼ばれるAIモデルに入力されて、埋め込みベクトルに変換されて、画像を生成するDiffusion Modelの画作りのガイドとして使用されます。 そのCLIPですが、入力された文章をトークナイザで意味のあるトークン(形態素と言ってよいのかな?)に分割するのですが、そのトークンが75個までという鉄の掟があります。75個以上はどうなるかというと後半が容赦なく捨てられます。 要は、Stable Diffusionに頑張って100や200の単語を超える長文プロンプトを入力しても、最初の75個分以降の文章は、バッサリ捨てられてしまうということです。 捨てられたらもったいないですね。事前にチェックする方法を記載したいと思います。 Google Colaboratory(Google Colab

    Stable Diffusionのプロンプトをチェックするテクニック
    mainyaa
    mainyaa 2022/09/22
  • 日刊 画像生成AI (2022年9月18日)|やまかず

    画像生成AI界は、今認識できないスピードで進化をし続けています。 DALL・E2公開、Midjourney公開、StableDiffusionがオープンソースで公開されて..進化の速度が上がり続けており、日々異常なスピードで変化しています。 "未知の可能性"そんな中、毎日時間なくて全然情報追えない..!って人のために業界変化、新表現、思考、問題、技術を毎日あらゆるメディアを調べ、まとめています。 昨日までの投稿はこちら 開発Satble Diffusion for Figma「Ando」が次はtextual inversionを実装するようです。以前かなり話題になったFigmaプラグイン「Ando」は2週間前から公開されていたのですがそれが今度はTextual Inversionで作られたスタイルを選ぶことができるようになるみたいです。 Shipped this AI design too

    日刊 画像生成AI (2022年9月18日)|やまかず
    mainyaa
    mainyaa 2022/09/21
  • Stable Diffusion入門-美少女を高確率で出す呪文 - 電通総研 テックブログ

    電通国際情報サービス、オープンイノベーションラボの比嘉康雄です。 Stable Diffusionシリーズ、今回は、美少女を高確率で出す呪文です。 Stable Diffusionで人物を出力するときに、顔が崩れている、目が変、口がない、腕(手)が変などを経験した方は多いことでしょう。NSFW(職場や学校で閲覧注意)が連続で出て、心が折れそうになった方もいることでしょう。僕もそのうちの一人です。 今回は、クオリティの高い人物画を高確率で出力し、NSFWもほとんど起きない呪文を研究しました。 v2.1 美少女アニメ画もよろしければご覧ください。 Stable Diffusionのおすすめコンテンツはこちら。 Waifu Diffusion 1.3.5_80000 v2.1 金髪美女写真 v2.1 美少女アニメ画 v2.1 AUTOMATIC1111 v2.0 美少女イラスト v1.5 美少女

    Stable Diffusion入門-美少女を高確率で出す呪文 - 電通総研 テックブログ
    mainyaa
    mainyaa 2022/09/21
  • Stable Diffusion web UI (AUTOMATIC1111) の使い方|npaka

    Stable Diffusion web UI (AUTOMATIC1111) の使い方をまとめました。 ・Windows 11 ・Stable Diffusion WebUI Docker v1.0.2 ・AUTOMATIC1111 1. AUTOMATIC1111「AUTIMATIC1111」は、「Stable Diffusion」のフォークの1つで、最も豊富な機能が提供されているフォークです。 主な特徴は、次のとおりです。 ・Text-to-Image : 多くのサンプラーとネガティブプロンプトが利用可能。 ・Image-to-Image : マスキング、トリミング、インペインティング、アウトペインティング、バリエーションが利用可能 ・GFPGAN、RealESRGAN、LDSR、CodeFormer ・ループバック、プロンプト重み付け、プロンプトマトリックス、X/Yプロット ・生成

    Stable Diffusion web UI (AUTOMATIC1111) の使い方|npaka
    mainyaa
    mainyaa 2022/09/18
  • naclbit/trinart_stable_diffusion_v2 · Hugging Face

    Please Note! This model is NOT the 19.2M images Characters Model on TrinArt, but an improved version of the original Trin-sama Twitter bot model. This model is intended to retain the original SD's aesthetics as much as possible while nudging the model to anime/manga style. Other TrinArt models can be found at: https://huggingface.co/naclbit/trinart_derrida_characters_v2_stable_diffusion https://hu

    naclbit/trinart_stable_diffusion_v2 · Hugging Face
    mainyaa
    mainyaa 2022/09/15
  • Stable Diffusion入門-美少女写真 - 電通総研 テックブログ

    電通国際情報サービス、オープンイノベーションラボの比嘉康雄です。 Stable Diffusionシリーズ、今回は、美少女写真の呪文です。 今回の記事は、レンズ編がベースになっています。まだ、ご覧になっていない方は、もしよろしければお試しください。 今回の企画は、【公開】Stable Diffusionで美しい女性のポートレートを描くの記事が素晴らしかったので、思いついた企画です。まだ、見ていない方は是非ご覧ください。 Stable Diffusionのおすすめコンテンツはこちら。 Waifu Diffusion 1.3.5_80000 v2.1 金髪美女写真 v2.1 美少女アニメ画 v2.1 AUTOMATIC1111 v2.0 美少女イラスト v1.5 美少女画検証 美少女アニメ画改善版 美少女を高確率で出す呪文 美少女アニメ画 美少女写真編 女性イラスト 魅惑的な女アニメ画(トゥー

    Stable Diffusion入門-美少女写真 - 電通総研 テックブログ
    mainyaa
    mainyaa 2022/09/13
  • 日刊 画像生成AI (2022年9月3日)|やまかず

    画像生成AI界は、今認識できないスピードで進化をし続けています。 DALL・E2公開、Midjourney公開、StableDiffusionがオープンソースで公開されて..進化の速度が上がり続けており、日々異常なスピードで変化しています。 "世界中の人々の力でめきめきと進化していくAI"そんな中、毎日時間なくて全然情報追えない..!って人のために業界変化、新表現、思考、問題、技術を毎日あらゆるメディアを調べ、まとめています。 昨日までの投稿はこちら (いいねくれるとやる気がでます、どんどん見てくれる人増えて嬉しい。)

    日刊 画像生成AI (2022年9月3日)|やまかず
    mainyaa
    mainyaa 2022/09/10
  • Google Colab で はじめる Waifu Diffusion v1.2|npaka

    「Waifu Diffusion v1.2」が二次元キャラの画像生成が得意らしいということで試してみました。 ・Diffusers v0.3.0 ・Waifu Diffusion v1.2 【最新版の情報は以下で紹介】 1. Waifu Diffusion v1.2「Waifu Diffusion v1.2」は、「Stable Diffusion」を二次元イラストのデータセットでファインチューニングして作られた画像生成AIです。Danbooruの画像で学習しています。 2. Colabでの実行Colabでの実行手順は、次のとおりです。 (1) 新規のColabのノートブックを開き、メニュー「編集 → ノートブックの設定」で「GPU」を選択。 (2) パッケージのインストール。 # パッケージのインストール !pip install diffusers==0.3.0 transformers

    Google Colab で はじめる Waifu Diffusion v1.2|npaka
    mainyaa
    mainyaa 2022/09/10
  • Stable Diffusion のプロンプトで意味の足し算・引き算をする

    TL;DR Stable Diffusion でプロンプトに重みをつけたり、意味の世界で足したり引いたりするよ 例: ピラミッド - エジプト + 日 = ? 画風をシームレスに変換できるよ seed 変更だと大きく変わってしまうけど、小さい重みで補正かければ構図を維持したまま絵に微調整を加えられるよ 意味の足し算・引き算 Stable Diffusion では、内部的に以下の 2 ステップの処理を行うことでテキストを画像に変換している テキストをベクトル(数の組)に変換する ベクトルを画像に変換する ところで、以下の動画を見てほしい テキストをベクトルにすることで、意味の世界で足し算や引き算が実現できている。 これを Stable Diffusion に応用したらどうなるだろうか[1]。 以下では、プロンプトの計算ができるように機能追加したStable Diffusionを用いる。 機

    Stable Diffusion のプロンプトで意味の足し算・引き算をする
    mainyaa
    mainyaa 2022/09/05
  • メルカリWebのマイクロサービス化、その4年 | メルカリエンジニアリング

    Author: @urahiroshi, Engineering manager of Web Platform team 2022年8月4日、メルカリで “web-2” と呼ばれるサーバがシャットダウンされました。これはメルカリWeb版の開発に携わっているチームにとって、一つの区切りとなる出来事でした。 web-2はPHPで記述されたwebサーバで、2015年から https://www.mercari.com/jp/ 配下のコンテンツを配信していましたが、現在では複数のWebマイクロサービスがその機能を担っており、 https://www.mercari.com/jp/ 配下のページは後継となるWebマイクロサービスが配信するページへリダイレクトされています。 メルカリWebのマイクロサービス化に向けた開発が始まり、最終的にweb-2がシャットダウンされるまで、実に4年以上の期間がかか

    メルカリWebのマイクロサービス化、その4年 | メルカリエンジニアリング
    mainyaa
    mainyaa 2022/09/02
  • Stable Diffusion を Google Colabで実行する際に便利なコード

    初めに Google Colaboratory で動かしていることを前提。 自分は Colab Pro にしているので、VRAMあたりで無料版の人は実行できないものがあるかも その際は出力する画像数とかを減らせばいけると思います。 出力する先をGoogle Driveにしたり、画像をいっぱい生成したりできるようにまとめてる記事が 見当たらなかったので作成。 セットアップ ほぼここを参照 家の見た方が質の理解には繋がるかも # パッケージのインストール !pip install diffusers==0.2.4 transformers scipy ftfy python-ulid # トークン変数の準備 YOUR_TOKEN="huggingfaceから取得した自分のトークン" from diffusers import StableDiffusionPipeline from tor

    Stable Diffusion を Google Colabで実行する際に便利なコード
    mainyaa
    mainyaa 2022/09/01
  • 魔術として理解するお絵描きAI講座|深津 貴之 (fladdict)

    やればやるほど呪術化する、AI画像錬成について。 以下は、その道の専門家にはメッチャ怒られるかもしれない、雑なロジックと制御講座。 いちおうメジャーなサービスでは、共通して動作するノウハウ(DALL-E2, MidJourney, StableEiffusion, DiscoDiffusion, crayon, dall-e mini 他)。 雑に理解する画像AIのしくみ対話型のAIにとって、呪文プロンプトとは画像錬成の方向性ベクトルを定めるものにすぎない。 たとえば、以下は「I love apple」で錬成された画像の例である。どうにも、ふわっとしたものが出てくる I Love AppleApple」という方向性ベクトルは、「リンゴ」「青リンゴ」と「アップルコンピューター(旧レインボーロゴ」「アップルコンピュータ(新ロゴ)」など、複数の可能性を同時に持つからだ。 つまり、「Apple

    魔術として理解するお絵描きAI講座|深津 貴之 (fladdict)
  • Midjourney/Memeplex(StableDiffusion)などの画像生成AIで思い通りの画像を出すヒント|shi3z

    このnoteの収益を使ってStable Diffusionを使ったWebサービス https://memeplex.appを公開しました。誰でも無料で何枚でもAI作画をすることができます(そのかわり、混み合ってる時は時間がかかると思います)。 このnoteで学んだことをぜひ活用して、AIによる新しい時代の風を感じてください。 また、文中にMidjourney、StableDiffusion、DreamStudio、Memeplexなどの言葉が頻出するため、全面的な修正を行うことにしました。StableDiffusionに統一しておきたいと思います。 現状(2022/8/28)は、StableDiffusion=DreamStudio/Memeplexと考えて構いません。Memeplexは将来的にStableDiffusion以外のアルゴリズムもサポートする予定だからです。

    Midjourney/Memeplex(StableDiffusion)などの画像生成AIで思い通りの画像を出すヒント|shi3z
  • Stephen Lacy on Twitter: "I am uncovering what seems to be a massive widespread malware attack on @github. - Currently over 35k repositories… https://t.co/rUKIIULV4V"

    I am uncovering what seems to be a massive widespread malware attack on @github. - Currently over 35k repositories… https://t.co/rUKIIULV4V

    Stephen Lacy on Twitter: "I am uncovering what seems to be a massive widespread malware attack on @github. - Currently over 35k repositories… https://t.co/rUKIIULV4V"
    mainyaa
    mainyaa 2022/08/03