anigokaのブックマーク - はてなブックマーク

画像生成AIに照明革命　日本と世界で同時に“神ツール”登場 (1/3)

この連載ではおなじみのキャラクター「明日来子さん」に右側からライトを当ててみた。左がIC-Lightを適用したもので、右がオリジナル。環境はWebUI Forge用の拡張機能を使用 5月8日に、「ControlNet」など画像生成AI関連の著名研究者であるイリヤスフィール（lllyasviel）さんが発表した「ICライト（Imposing Consistent Light、印象的な一貫的なライト）」が盛り上がりました。入力した画像をもとに、後から指定した照明効果を踏まえた画像を生成する技術です。画像生成AIで照明効果がつけられる「ICライト（IC-Light）」発表された学習済みモデルは、「ライトを指定すると、キャラクターのデータに合わせてテキストのプロンプトに合わせて独自に背景を生成するもの」「キャラクターとライトの影響を加味して、別の背景画像と合成するもの」の2種類があります。これ

anigoka 2024/05/28

これ、プロンプトで調整しないと元画像がアニメ調だったりするとリライトされた画像がリアル調とかに変わって作風変わっちゃうのよな…

SD

リンク

画像生成AIに“照明”革命　ControlNet開発者が作った「IC-Light」

画像生成AI関連の著名な開発者、lllyasviel（イリヤスフィール）氏が5月7日、生成AI画像の照明を自在に操作できるツール「IC-Light（Imposing Consistent Light）」を公開した。 2種類のモデルを公開 IC-Lightは画像の照明を操作するプロジェクト。前景画像（人物やオブジェクトなど）を入力し、プロンプトにテキストや背景画像を指定するだけで、まるで別の環境で撮影したかのような画像を得ることができるという。現在、「テキスト条件付きリライティングモデル（text-conditioned relighting model）」と「背景条件付きモデル（background-conditioned model）」の2種類がGitHubで公開されており自由に試すことができる。なお、作者のlllyasviel氏は「Stable Diffusion」のWebUIであ

anigoka 2024/05/10

フォージや1111とかのインターフェースのアドオン提供かと思ったら単体か

リンク

画像生成AIで同じキャラクターが簡単に作れるようになってきた (1/3)

画像生成AIサービスの「Midjourney」に3月12日、新機能「Creative Reference」が追加。1枚の画像から特徴を引き継いだ画像を生成できるようになり、同じキャラクターに別のポーズをとらせるなど様々な画像を作れるようになりました。これまで画像生成AI「Stable Diffusion」などで同じキャラクターの画像を作るには「LoRA」という追加学習をするのが一般的でしたが、それが必要ないため、キャラクターの再現が劇的に簡単になってきました。画像1枚で“似た顔”　Midjourneyの新機能「Creative Reference」使い方は、MidjourneyのDiscordに画像をアップロードして、「Creative reference」のタグ（cref）をつけてプロンプトを入力するだけ。CW 0〜100までのパラメーターがあり、0だと顔だけが共通になり、あとは数字

anigoka 2024/03/25

コントロールネットっぽい機能だなーと思ったらやっぱ出自が同じだったか｜これでタデちゃん創り放題やで！

リンク

昔はまったく売れなかった「電気の要らない自動ドア」が人気を集めているらしい

Newtonプラスが、3月2日、日本トーターグリーンドーム前橋で開催中の「UPDATE EARTH 2024 ミライMATSURI@前橋」で「電気を使わない自動ドア」を展示した。電気で開閉するから自動ドアなのに、電気を使わないとはどういうことか？　聞けば、床板に荷重がかかるとドアが開く構造を持った、機械式の自動ドアだという。電気によるランニングコストが発生しないことに加え、災害時や停電時でも開かなくなることがない安全性、人が乗っている限りは閉まることがないので、挟まれる心配もないなど、メリットは複数ある。建物の構造的に建築基準法をクリアできない場合を除き、既存の自動ドアを置き換える形で設置することも可能。主に自治体や、ビル内の授乳室、災害時の避難所の役割を果たしている地域の店舗やビルといった、公共性の高い場所への導入が進んでいるという。この製品、実は14年前に発売されているが、ほと

anigoka 2024/03/03

ステップ部分の凹み具合が気になる　蹴躓くほど深くはないだろうけど…｜↓いつまでも元気と思うな親と自分｜猫と幼すぎる子供に反応しないのはむしろメリットやろ

リンク

画像生成AI、安いPCでも高速に　衝撃の「Stable Diffusion WebUI Forge」 (1/4)

Stable Diffusion Forgeを表示した様子。基本的な操作は既存のStable Diffusion WebUI AUTOMATIC1111とほぼ同じ画像生成AI「Stable Diffusion」用の新しいユーザーインターフェース「Forge」が2月6日に登場しました。開発したのは、これまで「Controlnet」や「Fooocus」などStable Diffusion関連の様々な重要技術を開発してきたillyasviel（イリヤスベル）さん。何よりインパクトが大きいのは、グラフィックボードのVRAM容量が小さい安価なPCでも最新版のStable Diffusion XL（SDXL）が動かせることです。 RTX 40シリーズが求められたSDXL SDXLは、2023年8月にStabl ity AIが発表した画像生成AI。高画質な出力ができる一方、コミュニティーサイトで話題にな

anigoka 2024/02/26

controlnet対応のFooocus出てるの、ここの記事で初めて知ったわ　ほぇ～｜相変わらずくだらねえこと言ってる奴が2名ほど居るが以前よりはだいぶS/N比向上したな

SD

リンク

日本発の画像生成AIサービスがすごい　無料アップスケーラー「カクダイV1」 (1/4)

「カクダイV1」でアップスケールした画像（左）、「Midjouney v6」で作成したオリジナル画像（右）画像の描き込みを増やして高画質にする、日本発の生成アップスケーラー「カクダイV1」が2月7日に発表されて話題になりました。東大出身ベンチャーのMavericksが開発したもので、画像生成AI「Stable Diffusion」生成環境「ComfyUI」向けの技術として無料公開されています。人気アップスケーラー「Maginific AI」を超える製品にまでに成長していくのか注目です。 Stable Diffusionのアップスケールは難しかったカクダイを紹介する前に、まずは画像生成AIとアップスケーラーとの関係についてお話します。 Stable Diffusion登場後の画像生成AI 技術を使ったアップスケーラーは、単に画像を拡大させるだけの用途ではなくなりました。画像を拡大するとき、

anigoka 2024/02/19

ディテールが変わっちゃてるからこれ、アップスケールじゃなくてイメージエンハンスだな　厳密に言えばアップスケーラーとしては使い物にならない

リンク

モデムをつなぐのに必要だったRS-232-CというシリアルI/F　消え去ったI/F史 (1/3)

RISC-Vも一段落したところで、さて次に何をやろうかと編集氏と話あっていた時に出たお題が「あとやってないのは消えていったインターフェースですかね。IDEとかSCSIとかRS-232Cとか」。うん、まぁそれはアリだな、なんて思いながら仕事をしていた時に、いろいろ筆者にお題を下さることで定評のある(?)岩崎啓眞氏が「RS-232Cだった時代を知らない人たちの方が圧倒的に多い」なんて事をPostされてて、これはちょうど手頃なお題ではないか、と確信した次第。そうか…どんなPCでもたいていあった（もしくは準備可能だった）インターフェースがセントロとRS-232-Cだった時代を知らない人たちの方が圧倒的に多いわけだよなあｗ — 岩崎啓眞@スマホゲーム屋＋α (@snapwith) February 3, 2024 ということで、「昔のPCにはあったのに、もう今はどこに行ってしまったやら」というI/

anigoka 2024/02/12

25ピンタイプのシリアルあるの知らんかった　ほぇ～

リンク

画像生成AIが爆速で進化した2023年をまとめて振り返る (1/5)

Stability AIが画像生成AI「Stable Diffusion」を公開したのは2022年8月のこと。すさまじい勢いで発展してきた画像生成AIの1年を振り返ってみようと思います。初めに見てもらいたいのは「これが無料でいいのか!? “爆速生成AI”がペイントソフトに革命を起こした」で紹介した、KritaとGenerative AI for Kritaを組み合わせて作成した設定資料的な画像です。キャラクターの3面図のサンプル。Vroidで簡単な3Dで当たり（左）として、右の画像を作成する。それを元に、プロンプトや画像に描き込んだりして、最終画像を作成していく。2枚目には前面図の頭部のカチューシャや、胸部分のフリルがなかったりするが、そこに色を加筆して、プロンプトで指示すると、最終画像にそれが追加されるのをリアルタイムに確認しながら修正できる（筆者作成） Stable Diffusi

anigoka 2023/12/11

ある意味、EUのボケナスどものようなお気持ち元年でもある

リンク

これが無料でいいのか!? “爆速生成AI”がペイントソフトに革命を起こした (1/5)

Generative AI for Kritaのライブペインティング機能を実行している画面。左が筆者が描いた落書き。右が、その画像を線画（Scribble）としてAI生成した画像 11月13日掲載の記事「爆速化する画像生成AI」で紹介した新技術「Latent Consistency Models（LCM）」が大爆発しています。これは画像生成AIに2度目の革命を起こした「ControlNet」に次ぐ大インパクトではないかと感じています。「LCM-LoRA」（LoRAはStable Diffusion用の追加学習モデル）が11月下旬に登場したことで、リアルタイム生成のAI機能を組み入れたサービスやアプリの開発が一気に進みました。なかでも、筆者にとってインパクトが大きかったのが、ペイントソフト「Krita」向けに開発された「Generative AI for Krita」。Kritaはスウェー

anigoka 2023/12/05

購入しておきながらろくすっぽ起動もしない声だけデカいワナビー以下のエアプ自称絵師という反AIお気持ち勢をメイン購買層にしてしまったクリスタ、うぬの不運よ

リンク

画像生成AI「DALL·E 3」の性能が凄まじい。これを無料で使わせるマイクロソフトは本気で競合をつぶしに来ている (1/3)

10月1日頃、OpenAIの新しい画像生成AI「DALL·E 3（ダリ３）」が徐々に使えるようになり、その性能の高さから話題になっています。まずサプライズで使えるようになったのがマイクロソフトのBingチャット。日本語で「猫の画像を作ってください」などと入れるだけでかわいい猫の画像が出てくると。これが無料で使えるのは衝撃的です。マイクロソフトが巨大資本で他の会社をつぶしに来たなという感じですね。どう考えても、今のところはサーバーコストが果てしなくかかる赤字サービスなのは間違いないので……。「ラーメンを食べる女の子」が描ける！なにより衝撃的だったのは、「アニメ風の少女と猫が遊んでいる姿を作ってください」というリクエストに対し、一発で完璧な正解を出してきたことです。Stable Diffusionだと苦手とされていた指も適切に描写されています。もうひとつの着目点はオブジェクト間の関係性です

anigoka 2023/10/16

チンパイマン出す必要性のない絵を出す場合はこっちでいいかもな　SDXLも縛りキツくて結局エチぃの出せんしな…

リンク

商用利用OKのAIイラスト生成サービス「Emi」使ってみた (1/3)

AI Picassoが9月25日に公開した、アニメやマンガのようなAIアート生成に特化した画像生成AI「Emi（Ethereal master of illustration）」。無断転載画像を追加学習に使用していないと明言しており、商用利用可能ということもあって注目を集めている。「Stable Diffusion XL（SDXL）」ベースということで、SDXLを簡単に利用できる新しいWebUI「Fooocus」にも対応済み。どんな画像を生成できるのかさっそく試してみた。なお、「Fooocus」のインストール方法などについてはこの記事を参照してほしい。モデルをダウンロードして指定フォルダーに入れるだけまずは「Emi」のダウンロードから。Hugging Faceにあるダウンロードページから「emi_stable.safetensors」をダウンロードする。7GB近くあるので気長に待と

anigoka 2023/09/30

おなごよりロボのクオリティ高くて笑うわｗ｜”SDXLは以前ほど露骨な画像は出てこないように調整されている”勇次郎「強みを殺すな！」

リンク

アニメの常識、画像生成AIが変える可能性「AnimateDiff」のすごい進化 (1/3)

原画と原画の間にあたる画像を複数枚入れることで、自然な連続性のある動きを作る。アニメの基本となる「中割」作業を画像生成AIが実現する可能性が出てきました。鍵になっているのは「AnimateDiff」という技術。8月に入って、様々なユーザーのアップデートによって機能拡張が進められています。それは完全な画像生成AIで作られるアニメの可能性を垣間見せるほどのものです。 16コマ/2秒の短い動画が生成できる AnimateDiffは7月10日に発表された、上海AIラボ、香港中文大学、スタンフォード大学の共同研究による技術。画像生成AI「Stable Diffusion」の仕組みとデータセットを利用しつつ、数百万本の動画を学習させた「モーションモジュール」と呼ばれるデータセットを別途に参照させることで、連続するキャラクターの動きを生成可能にするというのが基本原理です。生成できる時間は、16コマ/2秒

anigoka 2023/09/11

マジすっご　俺のSDにも入れてみよ

リンク

データセンターの所在地ってやっぱり書いてはいけないのか？

いろいろなところからマサカリが飛んでくるのはわかっているが、以前から感じていた疑問について書いてみたい。「データセンターの所在地ってやっぱり書いてはいけないのか？」である。だって、ググれば所在地は出てくるんですよ。いろいろ秘密の多いデータセンターだが、インフラ界隈での内輪受けみたいな感じになっていやしませんかね。実は制約の多いデータセンター取材 ITインフラ系の記者は、たまにデータセンター見学ツアーに招待される。エクイニクスやさくらインターネット、NTTコミュニケーションズなど、私も相当データセンターは見ている方だ。Coltテクノロジー（旧KVH）はシンガポールまで、IIJはコンテナ型データセンターを見に島根まで行っている。IDCフロンティアに至っては北九州も、白河も、府中も見ている。 5月には大阪までデジタルエッジのデータセンターを見にいった。関西のデータセンター事情までいろいろ説明し

anigoka 2023/07/29

んなソ連時代の秘密都市じゃあるまいし…ｗ

リンク

世界を変えた画像生成AI、さらに進化「Stable Diffusion XL（SDXL）」いよいよ正式公開 (1/4)

Stability AIは6月26日、画像生成AIの最新モデル「Stable Diffusion XL」を発表しました（「画像生成AI『Stable Diffusion』最高性能の新モデル『SDXL 0.9』一般的なPCで実行可能」）。パラメーター数がオリジナルのStable Diffusionの9億から23億へと大幅に拡大され、描写力が飛躍的に上昇したモデルです。正式版のSDXL 1.0が7月18日に公開予定とあり、あらためて注目されています。ベータ版にあたるSDXL 0.9は先行して、有料課金サービス「DreamStudio」と、Discordでの公開を開始していました。Discordでは1人無料で1回出力可能で、いまもリアルタイムで生成画像が見える状態です。その後SDXL 0.9は研究用に公開されて、ダウンロード可能になりました。大きな違いは「2回生成する」こと SDXLがこれまで

anigoka 2023/07/17

”今回は学習データ元については明かさない方針にした”　クラピカ「答えは…沈黙！」｜モデルやVAEやLora持ってない素の既存SDは見られたモンじゃないのでここまで出来るのはスゴい

リンク

「撮影罪」はじまる、同意のない撮影は禁止　飛行機内の撮影にも注意を (1/2)

本日7月13日から「撮影罪」が施行される。これにより性的姿勢等のひそかな撮影（盗撮）、それらを第三者に提供する行為、インターネットや動画配信などで公開する行為、保管する行為がすべて処罰対象となり、盗撮に対して最大3年の拘禁または最高300万円の罰金が、不特定多数への提供行為に対してはさらに重い最大5年の拘禁、または最高500万円の罰金が科されることとなる。法律改正のきっかけとなった事例のひとつに、飛行機内での客室乗務員の盗撮行為がある。高速で飛行する航空機の特性が都道府県ごとの法制度の抜け穴を生み、特定できない場所での盗撮行為を処罰できず、客室添乗員の盗撮が法の抜け穴となってしまうといった実態があった。 ANAは「撮影罪」についてのポスターを羽田空港に掲示し、空港の利用客に向けて撮影罪の法制化、無断撮影禁止についての周知を始めている。「撮影罪」とは何か？「撮影罪」は正式名称を「性的な

anigoka 2023/07/14

なんか色々とシュリンクしてくなぁ　何も痰壺とゲロまみれの三丁目の夕日が良いとは言わんけどさー

リンク

画像生成AIに2度目の革命を起こした「ControlNet」 (1/4)

画像生成AI「StableDiffusion」の進化が止まりません。昨年8月にオープンソースとしてリリースされてから、世界中のプロアマ問わず多数の人たちが様々な研究成果を反映させ、毎日と言っていいほど新機能を誰かが発表するという状況が起きています。 StableDiffusion登場当初は、画像の品質のランダム性が高く、構図やポーズなどを指定できないという弱点を抱えていました。1枚の画像をもとに画像を生成する「i2i（image2image）」である程度コントロールすることはできても、「キャラクターに特定のポーズをとらせる」といったことは非常に難しかったんですね。その状況を一変させる新機能が今年2月に登場しました。その名も「ControlNet」。プロンプトによる制約を克服するための、とてつもないポテンシャルを持つ技術でした。Stable Diffusionに次ぐ「2度目の炸裂」と言って

anigoka 2023/05/23

爆速進化中のCNもそうだけどエクステンション含めて1111のUIの殆どがまだ俺にとって謎のままだよ…

SD

リンク

融合に失敗すると「絵が溶ける」!?　ベテラン作監が語る令和のアニメ制作事情 (1/3)

〈前回はこちら〉アニメ制作はアナログ作業とデジタル作業の融合だが…… 筆者が3月に文春オンラインに寄稿した記事「『ブラッククローバー』に『異世界おじさん』…アニメの放送休止・延期がなぜ続く？」には、一部のアニメーターの方々から厳しいご意見もいただいた。鉛筆から生まれる手描きの原画が、アニメの制作現場の最大のボトルネックになっているような印象を与えてしまったのが原因だが、80年代、90年代の手描き作画アニメを愛好する筆者としても現在のアニメを巡る危機的な状況の全体像を伝えることの難しさを感じた出来事だった。スタジオM2でのインタビュー後半は、前半に引き続き共同代表の丸山正雄氏、そして『PLUTO』の制作にも携わるアニメーターの野口征恒（まさつね）氏にお話をうかがった。『PLUTO』　STORY 憎しみの連鎖は、断ち切れるのか。人間とロボットが＜共生＞する時代。強大なロボットが次々

anigoka 2023/05/01

え、今どき位置ズレで苦労してんの…

リンク

「AIトレパク」が問題に (1/3)

3DアバターのVRMのスクショアプリ「VRM Posing Desktop」を使いVRMで画像（左）を作成後、Stable DiffusionのWebUIでimg2imgを行ってイラスト風の画像（右）を生成したもの。（画像：筆者作成）画像生成AIの「img2img」が議論を起こしています。 img2imgとは、画像生成AIの機能の1つ「Image-to-Image」の略称。画像を読み込ませて、テキストで指定するプロンプトと合わせて画像生成すると、元となる画像のイメージを踏襲した画像を作ってくれるという機能です。たとえば3DアバターのVRMデータを読み込ませるだけでアニメ風の絵が生成されます。パラメーターの設定次第ですが、元のキャラクターの特徴もそのまま踏襲させることが可能です。元となる画像を用意することで、同じ顔つきのやポーズの画像が生成を容易にすることができるわけですね。この原理を

anigoka 2023/01/26

証明はSDの機序的に無理なので、依拠性の如何を重箱の隅をつつくように互いに議論していくしかない　要は地獄が始まる

リンク

中国でブームの気配を見せて、すぐ沈静化した「スマートミラー」短命だった理由は？ (1/2)

中国では、縦長の大画面ディスプレーが局所的に盛り上がっていた。日本で超縦長のディスプレーというと、「ツイ廃」向けなどと言われた、NewBridgeの「8.8インチウルトラロングモバイルモニター」が話題になったが、中国ではフィットネスミラーとライブストリーム向けで製品が続々と発売された。このうちフィットネスミラーについて取り上げる。専業メーカーから、シャオミ、ファーウェイ、バイドゥまで大規模な資本調達もあって、ブームが起きた「スマートミラー」日本ではかなりのガジェット好きでもあまり知られていないが、中国で人気があった「スマートミラー」とは、スタンドミラーのように自身の全身を映しつつ、中にはディスプレーがあるというもので、レッスン動画を表示してユーザーの姿勢をAIで判定し、的確な指示を受けながらトレーニングレッスンができるといった製品だ。日本でも商品化されて、ジムなどには導入されている

anigoka 2022/12/25

思ったより白雪姫の義母マインドな人が居なかったんじゃね？

リンク

画像生成AIの激変は序の口に過ぎない (1/4)

画像生成AI「Stable Diffusion」がコンテンツ製作の技術革新を急速に促しているという話を「すさまじい勢いで世界を変えている画像生成AI」に書きました。あれから約2ヵ月が経ち、状況はさらに大きく変わってきています。 Novel AIソースコード流出事件最も影響が大きかったのは10月8日に起きたとされる「Novel AI」のソースコード流出事件です。どういった形でハッキングされたのかは明らかにされていませんが、流出したとされるコードはおそらく本物だという結論になっています。 Novel AIは10月3日にサービスが開始された画像生成AIサービス。Stable Diffusionや「Midjourney」と比べても圧倒的に高品質な日本アニメ風の画像出力ができることにより、日本やアジア圏で高い人気を得ています。 Googleトレンドの傾向を見てみても、日本ではNovelAIがリリー

anigoka 2022/12/03

くっそしょうもない根拠なき”倫理性”とやらでこうやって世界（主に中国）から取り残されるんやろなぁ

リンク

はてなブックマーク

タグ

ブックマーク / ascii.jp (69)

お知らせ

今週のはてなブックマーク数ランキング（2024年5月第4週）

今週のはてなブックマーク数ランキング（2024年5月第3週）

今週のはてなブックマーク数ランキング（2024年5月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス