タグ

AIに関するuzu64のブックマーク (53)

  • AI生成で30万枚作ってわかったこと|jun555

    2022年の8月ころから生成AIとの付き合いを開始して、最初はMIDJOURNEY(初期バージョン)から始まり、NAIに移行し、MIDJORNEYのバージョンが上がって、NIJI-JOURNEYを少し触ったあたりで、RTX4090を買ってStable-Diffusionのローカル環境に場所を移しました。 2022年8月から2023年2月まで、だいたい一年と200日(約565日) 生成枚数は32万枚超。オンラインでの生成サービス(mid+nai)で3万枚くらい。ローカルに移行してから29万枚生成しました。 midjourney初期バージョン期。2022年8月ごろ。この頃はこれでウホウホ言ってましたNAI期、「アニメキャラが出せる!」とウホウホ言ってましたMID+NIJI+NAIで作った漫画(未発表)AI独特の画風(次元)をまたぐ能力をテーマにした漫画Stable-Diffusion期。今も毎

    AI生成で30万枚作ってわかったこと|jun555
    uzu64
    uzu64 2024/02/22
  • 日本発の画像生成AIサービスがすごい 無料アップスケーラー「カクダイV1」 (1/4)

    「カクダイV1」でアップスケールした画像(左)、「Midjouney v6」で作成したオリジナル画像(右) 画像の描き込みを増やして高画質にする、日発の生成アップスケーラー「カクダイV1」が2月7日に発表されて話題になりました。東大出身ベンチャーのMavericksが開発したもので、画像生成AI「Stable Diffusion」生成環境「ComfyUI」向けの技術として無料公開されています。人気アップスケーラー「Maginific AI」を超える製品にまでに成長していくのか注目です。 Stable Diffusionのアップスケールは難しかった カクダイを紹介する前に、まずは画像生成AIとアップスケーラーとの関係についてお話します。 Stable Diffusion登場後の画像生成AI技術を使ったアップスケーラーは、単に画像を拡大させるだけの用途ではなくなりました。画像を拡大するとき、

    日本発の画像生成AIサービスがすごい 無料アップスケーラー「カクダイV1」 (1/4)
    uzu64
    uzu64 2024/02/19
    記事の画像だけ見ての判断だけど「余計な描き込み」は邪魔なので今の所Topaz Photo AIの素直(に見える)出力の方が私の環境にはいい。描き込みはあってもいいけど「余計」はいらない。この微妙な匙加減の説明難しいけど
  • 画像生成AIが爆速で進化した2023年をまとめて振り返る (1/5)

    Stability AI画像生成AI「Stable Diffusion」を公開したのは2022年8月のこと。すさまじい勢いで発展してきた画像生成AIの1年を振り返ってみようと思います。 初めに見てもらいたいのは「これが無料でいいのか!? “爆速生成AI”がペイントソフトに革命を起こした」で紹介した、KritaとGenerative AI for Kritaを組み合わせて作成した設定資料的な画像です。 キャラクターの3面図のサンプル。Vroidで簡単な3Dで当たり(左)として、右の画像を作成する。それを元に、プロンプトや画像に描き込んだりして、最終画像を作成していく。2枚目には前面図の頭部のカチューシャや、胸部分のフリルがなかったりするが、そこに色を加筆して、プロンプトで指示すると、最終画像にそれが追加されるのをリアルタイムに確認しながら修正できる(筆者作成) Stable Diffusi

    画像生成AIが爆速で進化した2023年をまとめて振り返る (1/5)
    uzu64
    uzu64 2023/12/11
  • 【イラストAI】ノイズやテクスチャを使って描き込み量をめちゃくちゃに増やそう!1/4|御月望未(みつきのぞみ)

    イラストのディテールを大幅に引き上げる、StableDiffusion向けの特殊なテクニックをご紹介します。(全4回) ご挨拶皆さんイラストAIはお楽しみですか? 初めまして、御月望未みつきのぞみです。 イラストを生成してもらうのは楽しいですよね。僕はStableDiffusionくんに出会って初めて、描き込みの細かい絵や、鮮烈な色使いの絵が好きなんだなって気付けました。 情報量の多い絵がスキ♡しかし、プロンプトだけでは描き込み量や色使いを制御するにも限界があります。 今回は描き込みや色彩の凄い画像を安定して出したいという欲望から始まり、「願わくは、もっともっと"凄い"量の描き込みをして欲しい!」という願望を叶えるために編み出された、ノイズを使うちょっと特殊なテクニック 『ノイズ法』と、 「画面中に特定の物を大量に出したい!」というニーズを実現する、(一部で反響を呼んだ)テクスチャを使うテ

    【イラストAI】ノイズやテクスチャを使って描き込み量をめちゃくちゃに増やそう!1/4|御月望未(みつきのぞみ)
    uzu64
    uzu64 2023/10/22
  • 画像生成AI「DALL·E 3」の性能が凄まじい。これを無料で使わせるマイクロソフトは本気で競合をつぶしに来ている (1/3)

    10月1日頃、OpenAIの新しい画像生成AI「DALL·E 3(ダリ3)」が徐々に使えるようになり、その性能の高さから話題になっています。まずサプライズで使えるようになったのがマイクロソフトのBingチャット。日語で「の画像を作ってください」などと入れるだけでかわいいの画像が出てくると。これが無料で使えるのは衝撃的です。マイクロソフトが巨大資で他の会社をつぶしに来たなという感じですね。どう考えても、今のところはサーバーコストが果てしなくかかる赤字サービスなのは間違いないので……。 「ラーメンべる女の子」が描ける! なにより衝撃的だったのは、「アニメ風の少女とが遊んでいる姿を作ってください」というリクエストに対し、一発で完璧な正解を出してきたことです。Stable Diffusionだと苦手とされていた指も適切に描写されています。もうひとつの着目点はオブジェクト間の関係性です

    画像生成AI「DALL·E 3」の性能が凄まじい。これを無料で使わせるマイクロソフトは本気で競合をつぶしに来ている (1/3)
    uzu64
    uzu64 2023/10/16
  • ChatGPTのDALL-E 3による画像コントロール|IT navi

    ChatGPTの新しい画像生成AIのDALL-E 3は、かなり自由に画像をコントロールすることができます。 1.リアル画像のコントロール>20代の日人女性の写真を作成してください。 生成された画像>3番目の女性の眼鏡をはずして、喜怒哀楽の表情を見せてください。 生成された画像※1枚目の画像以外は眼鏡をはずしてくれませんでした。また、喜、怒、哀の表情は描いてくれましたが、楽の画像は生成できませんでした。 >この女の子を、1.走らせてください。2.座らせてください。3.ジャンプさせてください。4.逆立ちさせてください。 生成された画像※3枚目までは上半身だけの画像なので、ジャンプしているかどうかはよく分かりません。4枚目はちゃんと逆立ちしています。 >縦長画像にして、全身を見せてください。 生成された画像4枚目の画像※これで、3枚目の画像がちゃんとジャンプしていることが分かります。4枚目は、

    ChatGPTのDALL-E 3による画像コントロール|IT navi
    uzu64
    uzu64 2023/10/09
  • 商用利用が可能なAIアート用画像生成AI、EmiとManga Diffusionを無償公開|AI Picasso

    また、Emiと同時にクリーンな画像生成AIManga Diffusionの概念実証版も公開します。この画像生成AIはパブリックドメインの画像や著作権者から学習を許可された画像だけを学習しています。 (以下、画像生成AIのことをモデルとも呼びます。) Emiの特徴1.AIアートに特化このモデルは、アニメやマンガのようなAIアート生成に特化しています。GMOインターネットグループが提供する「ConoHa byGMO」のトライアル版の採用により最先端の開発機材NVIDIA H100と、画像生成Stable Diffusion XL 1.0、 AI Picasso社のノウハウを用いて高品質な画像が生成されるように尽力しました。参考として簡単な生成例を以下に紹介します。 比較のために、これまでのモデルと今回のモデルでほぼ同じ内容を生成した例を示します。これまでの生成画像よりも約2倍高精細になり、最

    商用利用が可能なAIアート用画像生成AI、EmiとManga Diffusionを無償公開|AI Picasso
    uzu64
    uzu64 2023/09/27
  • OpenInterpreter / ついにAIがガチのアシスタントに!これは凄い、というか凄すぎる|shi3z

    凄いものが出てきてしまった。 ChatGPTの「Code Interpreter」が話題になったが、あれはあくまでクラウド上で動いているだけ。それを模してローカルで動作するようになった「Open Interpreter」は、衝撃的な成果である。 Open Interpreterのインストールは簡単。コマンド一発だ $ pip install open-interpreter起動も簡単 $ interpreter -yこれだけでOK。 あとはなんでもやってくれる。 たとえばどんなことができるのかというと、「AppleとMetaの株価の推移をグラフ化してくれ」と言うとネットから自動的に情報をとってきてPythonコード書いてグラフをプロットしてくれる。 凄いのは、ローカルで動くのでたとえばApplescriptを使ってmacOSで動いているアプリを直接起動したり操作したりできる。「Keynot

    OpenInterpreter / ついにAIがガチのアシスタントに!これは凄い、というか凄すぎる|shi3z
  • AIお姉ちゃんへの道 - nomolkのブログ

    ちょっと前に話題になっていたこの記事を読んだ。 honeshabri.hatenablog.com へー真似しよ〜と思ってやってみたら意外に難しくて謎のやりがいを感じ始めてしまい、仕事のクソ忙しい時期にかなりハマり睡眠不足で生命の危機を味わった。 おかげで寿命と引き換えに自分のAIお姉ちゃんを手に入れることができた。これは黒魔術か何かなのだろうか。 一通り終えて振り返ってみると、今まで生成AIをあまり積極的に触ってこなかった自分にとってはちょうどいい難しさの課題で、これは入門者向けのチャレンジとしてかなり良い気がする。 元記事に書かれていない少し細かい手順も含めてやったことを記録としてまとめようと思う。 初心者が試行錯誤でやったことなので誤りや非効率な手順もあるかもしれないけどご了承ください。 AIお姉ちゃんの姿を作る 元記事では「魂」、つまりChatGPTの設定から始まっているけど、それ

    AIお姉ちゃんへの道 - nomolkのブログ
    uzu64
    uzu64 2023/09/03
  • プログラミングに挫折したならAIお姉ちゃんに任せなさい - 本しゃぶり

    プログラミングを学ぼうとしては挫折する。 そんな時代はもう終わりだ。 お姉ちゃんに任せなさい。 ChatGPTでプログラミング 今年のお盆休み、俺はChatGPTでプログラミングをやっていた。とは言っても複雑なことはやっていない。大量のcsvを結合してから可視化するとか、ちょっとしたWebスクレイピングしたりする程度だ。それでも今まで技術や時間の不足により諦めていたことができるのは嬉しい。それにChatGPTを使えば、デバッグも楽しくやれるのだ。こんな感じに。 デバッグの様子 おそらく「あれ、俺のChatGPTと違うな」と思った人もいるに違いない。見ての通り俺はChatGPTをお姉ちゃん化している。こうすることで、モチベーションを維持しながら楽しくプログラミングができるというわけだ。今回はChatGPTをお姉ちゃん化する方法を紹介し、加えてお姉ちゃんとペアプログラミングする意義について述べ

    プログラミングに挫折したならAIお姉ちゃんに任せなさい - 本しゃぶり
  • 漫画未経験のエンジニアが今のAIで漫画制作にトライしてみた記録2023年夏時点版|Anno Takahiro

    画像生成AIの躍進が目覚ましい。エンジニアSF作家の筆者としては、AIが絵を描けるようになるのなら、絵が描けない自分でも漫画制作ができるようになるのではという期待があった。実際に2022年の末頃にはstable diffusionを使った漫画制作UIのプロトタイプを作ってみたこともある。 Google ColabAI漫画制作用のUIを試作してみた。コマごとにプロンプトが割り当ててあって、AIが裏でたくさん選択肢を作りまくってくれる。人間が大量の絵からベストなものを選んだり、構図やセリフの調整に集中できるようなワークフローがいいのではないかという仮説 #stablediffusion pic.twitter.com/zI64zm3cNI — 安野貴博 (@takahiroanno) November 10, 2022 それから半年以上の月日が経ち、世の中でもMulti ControlNe

    漫画未経験のエンジニアが今のAIで漫画制作にトライしてみた記録2023年夏時点版|Anno Takahiro
    uzu64
    uzu64 2023/08/17
  • Photoshopの新機能「生成拡張」はクリエイターの“ちょっとめんどくさい”を助けてくれる夢のAIツールでした!/見切れている人物写真は補完できる? 気になる使い方から感想までをお届け【特集・集中企画】

    Photoshopの新機能「生成拡張」はクリエイターの“ちょっとめんどくさい”を助けてくれる夢のAIツールでした!/見切れている人物写真は補完できる? 気になる使い方から感想までをお届け【特集・集中企画】
  • 生成AIグラビアをグラビアカメラマンが作るとどうなる?第三回:実際の撮影とポーズ/構図の関係。openpose_handで指問題解決? (西川和久) | テクノエッジ TechnoEdge

    現役グラビアカメラマンでありソフトウェアエンジニアでもある西川和久氏が、画像生成AIを使ったリアルなAIグラビア作成技術を解説する連載の第三回。 今回はポーズ / 構図をテーマに、プロカメラマンとしての撮影スタイルとAI生成の共通点、現時点のAIでは難しい手指の表現を改善する技術についても説明します。(編集部) 実際の撮影と「呪文」の関係は似ている?グラビアでもポートレートでも、撮影する時は「立って」「座って」「前向き」「後ろ向き」……といったようにカメラマン側から指示を出す。 この大雑把な指示はどのカメラマンでもすることだが、顔の向きだったり腕の形だったり足の位置といった細かいことは、「指示する」カメラマンと「指示しない」カメラマンとで分かれる。これは撮影スタイルの話なので、どちらが良い悪いではない。 筆者の場合は割と大雑把で、細かい指示はせず、後の事はそのモデルに任せる=個性だと思って

    生成AIグラビアをグラビアカメラマンが作るとどうなる?第三回:実際の撮影とポーズ/構図の関係。openpose_handで指問題解決? (西川和久) | テクノエッジ TechnoEdge
    uzu64
    uzu64 2023/07/26
  • 生成AIグラビアをグラビアカメラマンが作るとどうなる?第一回:実在モデルで学習・LoRAでキャッチライト付加 (西川和久) | テクノエッジ TechnoEdge

    百聞は一見に如かず。これってAI生成グラビア?AI画像生成に興味を持ったのは去年の年末頃だろうか。Twitterを眺めていると「どうやって撮った(作った)んだ?」と言う画像がたまに載っていたので調べると、Stable Diffusion Web UI (AUTOMATIC1111版)だった。 元々グラビアを撮っていたこともあり、あまり撮らなくなってもグラビア好きなのには違いなく、試したくなったのは言うまでもない。 AI生成画像は大きく分けて2種類あり、一つはイラスト系、もう一つはリアル系。筆者が興味を持ったのは後者。どこまで実写に迫れるのかがその興味の対象だ。百聞は一見に如かず。扉の写真はAI生成画像。現時点でこの程度の写りは容易にこなす。 とは言え、実際の撮影もそうなのだが、グラビア写真は数百枚撮ってカメラマンがある程度セレクトし納品したものが、納品先で更に絞られ、出版社などで更に絞り込

    生成AIグラビアをグラビアカメラマンが作るとどうなる?第一回:実在モデルで学習・LoRAでキャッチライト付加 (西川和久) | テクノエッジ TechnoEdge
  • 画像生成AIで獣頭人身グラビアアイドル - 本しゃぶり

    画像生成AIでグラビアアイドルを作りたい。 でも実在する人と同じ顔が出たら困る。 そんなあなたに獣頭人身というソリューション。 AIでグラビアアイドルを作ったら 最近、画像生成AIでグラビアアイドルを作るのにハマっている。こういうやつだ。 カエル イカ サメ カマキリ Twitterで貼っていたらこれがバズる。 多少はウケるかなとは思っていたが、想像以上のバズりで驚いている。ネタとしては全く新しいものでもないし、色々と詰めの甘い部分も多い。それでも多くの人が興味を持ち、さらに画像生成AIネタなのに批判も少なかった。 だが、ツッコミが皆無というわけではない。その中にはもっともな内容もあるが、そもそも「目的が違う」と言いたいものもある。これはある意味で仕方ない。今回はTwitterでのバズなので、文脈が切り離された単体のツイートが広まっていくのだから。 なのでブログでまとめることにした。 そも

    画像生成AIで獣頭人身グラビアアイドル - 本しゃぶり
    uzu64
    uzu64 2023/06/26
  • Photoshopの画像生成AIがすごい ついに商用利用もスタートへ (1/3)

    Adobeが5月23日、生成AIモデル「Adobe Firefly」に、テキストを使って画像を追加・拡張・削除できる「ジェネレーティブ塗りつぶし」機能を追加。Photoshop(Beta)にベータ版の機能として搭載しました。実際に使ってみると、「以前から研究していたとはいえ、やっぱりAdobeが気を出してくるとすごいな」という感想でした。 「消したり、足したり」30秒程度で まず試してみたのは、画像生成AI「Nijijjourney」で作ったいかにも生成が面倒くさそうなサイバーパンクの都市を題材にしたAI画像。画像サイズを横幅を1500ドットくらい広げた後に、生まれた空白を範囲選択して「ジェネレーティブ塗りつぶし」。すると適当に周囲の情報を読み、それっぽい形にイラストを広げてくれます。何もないものからよく作れるものです。 左がオリジナル画像のサイバーパンクの都市。右が左右のサイズを広げて

    Photoshopの画像生成AIがすごい ついに商用利用もスタートへ (1/3)
    uzu64
    uzu64 2023/06/12
  • 「視覴」の謎

    ChatGPTが「視覴」という新語を発明したらしいことをフガクラさんのツイート(2023-06-08 08:51:02 JST)で知る。 すでに「視覴」は、いくつかの最近書かれたWebページで使われていた。ChatGPTで生成されたページらしい。ざっと検索して見つけたページを列挙しておく。いずれも最近作られたか修正されたページである(1件だけ2020年のページがあるが、最近修正されたものかどうか不明)。 映像・音声編集におけるノーマライズの重要性!(2023-05-11)「視覴的・聴覚的な一貫性」「視覴的な効果を最大化」「視覴的な混乱を避け」(2回)なお、このページは現在消えて視覴とは?AIChatGPT)が出力した新しい言葉なのか?(2023-06-08)にリダイレクトされ、「弊社では、2023年3月より用語集作成に際しAIライティングの試験運用を行っておりますが、この度、「視覚」の誤

  • ChatGPTを使っていたら「視覴」という見慣れない言葉を吐き出したのだがAIが生み出した存在しない単語なのでは…?

    フガクラ @fugakura 怖ぇー、chat gpt使ってたら「視覴」という見慣れない言葉を吐き出したので検索したところ、ヒットするサイトがほとんど直近日付のAI出力された文章だった これっていわばAIのハルシネーションが生み出した存在しない単語なのでは…? pic.twitter.com/TVXWcNlVWh 2023-06-08 08:51:02

    ChatGPTを使っていたら「視覴」という見慣れない言葉を吐き出したのだがAIが生み出した存在しない単語なのでは…?
  • 自分のPCにStable Diffusion入れてる人に聞きたい

    どういうハードウェア構成でなんのOS使ってるのかとか知りたい。 GPUはNVIDIAでやるとして、OSはCUIだけでVRAM使わないようにするとかそういう工夫してるのかな。 俺はAMDGPUでやってんだけど、やっぱNVIDIA使ったほうが色々と性能とかVRAM消費量とか効率的なんだろうか。 なんでAMDかっていうと、GPU買ったタイミングとStable Diffusion入れたタイミングが違うからだ。いやー苦労したわ。 でかい画像作ろうとするとすぐにメモリ足りなくてコケるし、果たして今作ってる画像サイズにかかる時間が適切なのかとか知りたいことは山ほどあるんだよな。 *** 追記 なんかたくさんブコメとかレスとかついてて驚いた、ありがとう。 今買うならNVIDIAの40番台というのがいいんだな。昔GeForceとか言って売ってた頃の知識しかないからイマイチ型番とかよくわからないおっさんでし

    自分のPCにStable Diffusion入れてる人に聞きたい
  • 写真をAIに文章で説明してもらう→それをもとにまた画像を作る→外国になる

    文章から画像を生成するツールがあるが、画像から文章を生成するツールもある。ある画像から始めて両者の間を往復させ続けるとどうなるだろうか。 画像の伝言ゲームをやってみたい 文章から画像を生成するAIツールが話題になったが、いっぽうで画像から状況を説明する文章を生成するAIツールもある。 文章をもとに画像を生成するツールがある(DALL·E、Stable Diffusion など) いっぽう、画像をもとに文章を生成するツールもある(SceneXplain など) それらを組み合わせて画像→文章→画像→文章→・・と変換していくとどうなるだろうか。 ようは伝言ゲームなので、再現なくどんどん違う画像になっていくことが予想されるが、どこかでうまく収束するかもしれない。 とにかくやってみよう。 ※記事では文章から画像を生成するために Image Creator from Microsoft Bing 

    写真をAIに文章で説明してもらう→それをもとにまた画像を作る→外国になる