hetohetoのブックマーク - はてなブックマーク

危機的状況の画像生成AI「Stable Diffusion 3」立て直しへ (1/4)

発表後、悪い意味で話題になってしまっていた画像生成AI「Stable Diffusion 3 Medium（SD3M）」に動きがありました。開発元のStability AIは、Weta Digitalの元CEOのプレム・アッカラジュ（Prem Akkaraju）氏がCEOに就任し、新たな資金も調達しました。これで組織として当座の危機は脱したと言えそうです。また、Stable Diffusion 3（SD3）のライセンスについての変更を打ち出してきました。果たして失われた信頼は取り戻せるでしょうか。人気モデル「Pony Diffusion」開発者との対立基本的な情報からすると、やはり、SD3Mはコケたと言っていい状況です。参考情報となりますがGoogleトレンドを見てみると、6月12日のリリース直後は1日で150万ダウンロードされるほど注目を集めていたものの、すぐにシュリンクしてしまって

hetoheto 2024/07/15

人間はAIに滅ぼされるまでもなく人間同士で滅ぼしあうのか

リンク

AI動画の品質が仕事に使えるレベルになってきた (1/4)

Luma AIが6月12日に公開した動画生成AIサービス「Dream Machine」が、月に無料で30回まで試せることもあって、大きな話題となっています（「ついに来た! 無料で試せる動画生成AI『Luma Dream Machine』」参照）。ただ、技術情報は出ておらず、どういう関係や経緯で出しているかは一切不明です。 ※記事の配信先によっては動画や図版がうまく表示されないことがあります。その場合はASCII.jp掲載の記事をご覧ください手軽に高品質な動画が生成できる「Luma AI」のサービス Luma AIはこの連載でも何回か紹介してきたように、大量の写真から3Dモデルを生成するサービスからスタートし、昨年12月には3Dモデル生成サービス「Genie」で参入しているAIスタートアップ企業です（連載第41回「3Dスキャンの進化がすごい」参照）。生成AIの3D化技術で先行していることか

hetoheto 2024/07/02

映画とか長いのは無理だけど、CMとかMVとか、映画でも部分的にVFXが置き換えられる可能性はある。けどいかにもつまんないものが並びそうだし規制とか出来てくる可能性も

リンク

Windowsはなぜ再起動が必要になるのか？ (1/2)

Windowsでは、Windows Updateの直後やアプリケーションなどのインストール後に再起動が要求されることがある。以前に比べると、再起動にかかる時間は短縮されたものの、開いているプログラムを閉じてファイルを保存する必要があるなど、ちょっと面倒ではある。なお、システムの再起動は、何もWindowsだけでなく、Linuxなど他のプラットフォームでも必要になることはある。とはいえ、ちょっとしたアプリケーションのインストールやアップデートの後に再起動が要求されるなど、頻度が高い気がしないでもない。今回は、この再起動について調べる。 Windows Updateが再起動を要求するとき Windows Updateの場合、再起動が必要になるのは大きく2つの理由がある。1つはWindows自体の更新で、このときにWindowsのインストールイメージが作られて再起動。Windowsの再インスト

hetoheto 2024/07/01

これが面倒でMacにしたまである。Macは再起動自体も少ないけど、ウィンドウやデスクトップを保存してくれるので楽

リンク

画像生成AIに照明革命　日本と世界で同時に“神ツール”登場 (1/3)

この連載ではおなじみのキャラクター「明日来子さん」に右側からライトを当ててみた。左がIC-Lightを適用したもので、右がオリジナル。環境はWebUI Forge用の拡張機能を使用 5月8日に、「ControlNet」など画像生成AI関連の著名研究者であるイリヤスフィール（lllyasviel）さんが発表した「ICライト（Imposing Consistent Light、印象的な一貫的なライト）」が盛り上がりました。入力した画像をもとに、後から指定した照明効果を踏まえた画像を生成する技術です。画像生成AIで照明効果がつけられる「ICライト（IC-Light）」発表された学習済みモデルは、「ライトを指定すると、キャラクターのデータに合わせてテキストのプロンプトに合わせて独自に背景を生成するもの」「キャラクターとライトの影響を加味して、別の背景画像と合成するもの」の2種類があります。これ

hetoheto 2024/05/27

不自然なライティングは写真というより絵に近くなってくるから本末転倒に思えるが…

リンク

漫画家の絵柄、AIでそっくり再現「ピュアモデルAI」ができたワケ (1/3)

発表当初は、画像生成AIに詳しいXユーザーのあいだで「画像生成AI『Stable Diffusion』で、追加学習モデル『LoRA』を使っているだけでは」という疑問の声も出ていたが、エンドルフィンは4月5日にプレスリリースを出し、「私たちが提供しているサービスは、公開されている汎用モデルを活用した生成AIとは一線を画しています」として、画像の生成までに独自のプロセスを踏んでいる旨を説明している。話題の「ピュアモデルAI」ができた経緯や、その技術的背景について、連載「メタバース・プレゼンス」を執筆している新清士氏とアスキー編集部で、エンドルフィンの代表と、サービス開発元のスーパーエンジンのCEOに話を聞いた。生成AIは「アナログからデジタル」の変化と同じ ──　最初にそれぞれの会社について教えてください。ジェームズ　キム・ドンジュン　2022年下半期ごろから、生成AIに関心をもって、

hetoheto 2024/04/29

“アナログでやっていた人が猛反発したことはありました”いやいや、ここまでの混乱や反発は無かったよ。寺沢武一とかモンキーパンチとかベテラン勢も使っていたし、先進的でカッコいいイメージがあった。

リンク

日本発のリアルタイム画像生成AIサービスが熱い　大手にとっては“イノベーションのジレンマ”に (1/3)

Akuma.ai http://akuma.ai 2024年2月、日本発のクラウド型画像生成サービスAkuma.aiが、リアルタイム画像生成機能「AIキャンバス」を搭載したことが話題になりました。3月1日には生成枚数が延べ1200万枚に達したと発表。リアルタイム画像生成技術「LCM」を組み入れたサービスですが、高度なPC環境が不要で、タブレットなどからでも簡単に使えるため、国内外の幅広い層にウケたという経緯です。 🎉生成画像1200万枚突破🎉 リアルタイム「AIキャンバス」生成枚数が1200万枚を突破しました！たくさんご利用いただきありがとうございます。今後とも #AkumaAI の応援よろしくお願いします🦑 プレスリリースはこちら：https://t.co/Yf3tjxjCsS — Akuma.ai (@AkumaAI_JP) March 1, 2024 日本発の画像生成AIサ

hetoheto 2024/03/18

あとで読む

リンク

Stable Diffusionで画像からプロンプト（呪文）を生成・抽出する方法。Fooocusの新機能「Describe」が便利でした (1/3)

本連載「Stable Diffusion入門 from Thailand」は、2024年に入って1回目。今年も「Stable Diffusion」をメインに、画像生成AI周辺の話題について入門者視点でお伝えしていきたい。今回の話題は、Stable Diffusionを手軽に使えるユーザーインターフェースの「Fooocus」。12月13日にリリースされた新バージョン「Fooocus 2.1.831」には、画像をアップロードするとテキストプロンプト（呪文）を生成する「Describe」機能が追加されている。画像をドラッグ＆ドロップしてボタンを押すだけ

hetoheto 2024/01/17

あとで読む

リンク

画像生成AIが爆速で進化した2023年をまとめて振り返る (1/5)

Stability AIが画像生成AI「Stable Diffusion」を公開したのは2022年8月のこと。すさまじい勢いで発展してきた画像生成AIの1年を振り返ってみようと思います。初めに見てもらいたいのは「これが無料でいいのか!? “爆速生成AI”がペイントソフトに革命を起こした」で紹介した、KritaとGenerative AI for Kritaを組み合わせて作成した設定資料的な画像です。キャラクターの3面図のサンプル。Vroidで簡単な3Dで当たり（左）として、右の画像を作成する。それを元に、プロンプトや画像に描き込んだりして、最終画像を作成していく。2枚目には前面図の頭部のカチューシャや、胸部分のフリルがなかったりするが、そこに色を加筆して、プロンプトで指示すると、最終画像にそれが追加されるのをリアルタイムに確認しながら修正できる（筆者作成） Stable Diffusi

hetoheto 2023/12/11

進化して思う通りの物が作れるようになるとかかえって微妙になるってくると思う。いくらAIが優れてても生成者の指示内容やセンスを超えられないからだ。

リンク

これが無料でいいのか!? “爆速生成AI”がペイントソフトに革命を起こした (1/5)

Generative AI for Kritaのライブペインティング機能を実行している画面。左が筆者が描いた落書き。右が、その画像を線画（Scribble）としてAI生成した画像 11月13日掲載の記事「爆速化する画像生成AI」で紹介した新技術「Latent Consistency Models（LCM）」が大爆発しています。これは画像生成AIに2度目の革命を起こした「ControlNet」に次ぐ大インパクトではないかと感じています。「LCM-LoRA」（LoRAはStable Diffusion用の追加学習モデル）が11月下旬に登場したことで、リアルタイム生成のAI機能を組み入れたサービスやアプリの開発が一気に進みました。なかでも、筆者にとってインパクトが大きかったのが、ペイントソフト「Krita」向けに開発された「Generative AI for Krita」。Kritaはスウェー

hetoheto 2023/12/04

結局「描く」行為に近い程、描いてる人のセンスがモロに出るので、かえって微妙な感じになる気がする。触っていて楽しいのとクオリティはまた別の話

リンク

画像生成AI「DALL·E 3」の性能が凄まじい。これを無料で使わせるマイクロソフトは本気で競合をつぶしに来ている (1/3)

10月1日頃、OpenAIの新しい画像生成AI「DALL·E 3（ダリ３）」が徐々に使えるようになり、その性能の高さから話題になっています。まずサプライズで使えるようになったのがマイクロソフトのBingチャット。日本語で「猫の画像を作ってください」などと入れるだけでかわいい猫の画像が出てくると。これが無料で使えるのは衝撃的です。マイクロソフトが巨大資本で他の会社をつぶしに来たなという感じですね。どう考えても、今のところはサーバーコストが果てしなくかかる赤字サービスなのは間違いないので……。「ラーメンを食べる女の子」が描ける！なにより衝撃的だったのは、「アニメ風の少女と猫が遊んでいる姿を作ってください」というリクエストに対し、一発で完璧な正解を出してきたことです。Stable Diffusionだと苦手とされていた指も適切に描写されています。もうひとつの着目点はオブジェクト間の関係性です

hetoheto 2023/10/16

クオリティもだけど、無料で誰でもアクセス出来るのがデカい。ブラウザでもSkypeでも何でも使えるようになってる

リンク

伊藤園「おーいお茶」CMに生成したAIタレントを起用

伊藤園が「お～いお茶カテキン緑茶」のテレビCMにAIタレントを起用した。AIタレント事業を手がける企業AI modelが、自社のAIタレントが採用されたことを10月3日に公表した。 CMに登場するAIタレントの名称は明らかにされていない。CMはテレビのほか、伊藤園の公式YouTubeチャンネルでも公開されており、本物の人間と見分けがつかないレベルの仕上がりだ。 AI modelによると、AIタレントが登場するテレビCMは日本初になるという。同社は発表に際して「AI 技術で生成したAI model（AIモデル）を活用して、モデル撮影の創造性や表現の豊かさを広げて、そこから得られる新しい価値などを提供していくことで、広告やファッションなど様々な業界の発展に貢献していきます」と述べている。「お～いお茶カテキン緑茶」シリーズは伊藤園が9月4日より販売を開始した製品。同シリーズはテレビCM以外

hetoheto 2023/10/15

これ多分、体は普通の人で顔をi2iで差し替えてるんだよね？手タレならぬ身体タレの爆誕か…

リンク

アニメの常識、画像生成AIが変える可能性「AnimateDiff」のすごい進化 (1/3)

原画と原画の間にあたる画像を複数枚入れることで、自然な連続性のある動きを作る。アニメの基本となる「中割」作業を画像生成AIが実現する可能性が出てきました。鍵になっているのは「AnimateDiff」という技術。8月に入って、様々なユーザーのアップデートによって機能拡張が進められています。それは完全な画像生成AIで作られるアニメの可能性を垣間見せるほどのものです。 16コマ/2秒の短い動画が生成できる AnimateDiffは7月10日に発表された、上海AIラボ、香港中文大学、スタンフォード大学の共同研究による技術。画像生成AI「Stable Diffusion」の仕組みとデータセットを利用しつつ、数百万本の動画を学習させた「モーションモジュール」と呼ばれるデータセットを別途に参照させることで、連続するキャラクターの動きを生成可能にするというのが基本原理です。生成できる時間は、16コマ/2秒

hetoheto 2023/09/11

現状では微妙だけど、イラストはたった1年で神絵師のレベルになったからね。しかも誰もが使える形で。この先神アニメーターレベルになる可能性はゼロではない

リンク

画像生成AI「Midjourney」で同じキャラをコスプレさせて遊ぶ方法 (1/2)

画像生成AI「Midjourney」を使ったAIイラスト制作TIPSをお届けしています本連載、今回は、Midjourneyを使って、同一キャラのコスプレ、要するに衣装替えを実現する方法をご紹介したいと思います。 Midjourneyは現在V5.2が公開されていますが、このバージョンから新たに追加された機能に「ズームアウト」と「パン」があります。ズームアウトは、ひとつの画面からその外側にある風景を追加描写する、画像生成AI界隈では、いわゆる「アウトペイント」と呼ばれる機能。もう一方のパンは、アウトペイントを上下左右の指定方向にだけ行い、カメラを振った（パンした）かのように描写する機能です。 Midjourneyのアウトペイントは少し特徴的です。他の画像生成AIのアウトペイントが描画領域を追加してそこを描画していくのに対し、Midjourneyのそれは、元の絵を極力改変せずに縮小させて周囲に

hetoheto 2023/07/22

あとで読む

リンク

世界を変えた画像生成AI、さらに進化「Stable Diffusion XL（SDXL）」いよいよ正式公開 (1/4)

Stability AIは6月26日、画像生成AIの最新モデル「Stable Diffusion XL」を発表しました（「画像生成AI『Stable Diffusion』最高性能の新モデル『SDXL 0.9』一般的なPCで実行可能」）。パラメーター数がオリジナルのStable Diffusionの9億から23億へと大幅に拡大され、描写力が飛躍的に上昇したモデルです。正式版のSDXL 1.0が7月18日に公開予定とあり、あらためて注目されています。ベータ版にあたるSDXL 0.9は先行して、有料課金サービス「DreamStudio」と、Discordでの公開を開始していました。Discordでは1人無料で1回出力可能で、いまもリアルタイムで生成画像が見える状態です。その後SDXL 0.9は研究用に公開されて、ダウンロード可能になりました。大きな違いは「2回生成する」こと SDXLがこれまで

hetoheto 2023/07/17

これは流行りませんねえ

リンク

ゲームの“自動生成”技術がすごいことになっている (1/4)

いま生成AIが話題になっていますが、AI 技術の一つである「プロシージャル生成」の考えも重要です。プロシージャルというのは数式や関数にもとづき3Dコンテンツを生成する手法で、「手続き型」とも言われます。自動的にデータを作り出すという側面から、生成AIとプロシージャル生成は混同されることがありますが、実はまったく違う背景を持つ技術です。Epic Gamesが新たにゲームエンジン「Unreal Engine 5.2」に搭載したプロシージャルコンテンツ生成機能（PCG）は驚くべきものでした。3月のGDCで発表されていたデモマップ「Electric Dream」が6月21日に公開されています。今回はこのデモマップを使って技術を紹介しながら、生成AIとの違いを見ていきます。お待たせしました！ Electric Dreams 環境サンプルプロジェクトを無料公開しました！#UnrealEngine 5

hetoheto 2023/07/10

あとで読む

リンク

9時間かかる仕事、6分で終了パナ子会社「ChatGPTはビジネスに有効」 (1/3)

パナソニック独自AIサービスの活用実績を報告する、パナソニックコネクト IT・デジタル推進本部戦略企画部シニアマネージャーの向野孔己氏パナソニック子会社のパナソニックコネクトは6月28日、OpenAIの大規模言語モデルをベースにしたAIアシスタントサービス「ConnectAI」の活用実績を報告。今後は機能を拡大し、社内データを活用できるシステムへアップデートすると発表した。社内利用は「想定の5倍」「ConnectAI（旧称ConnectGPT）」は、日本マイクロソフトがMicrosoft Azure上で提供する「Azure OpenAI Service」を活用し、パナソニックコネクトが2023年2月から、国内の社員1万3400人に提供しているサービス。当初は「GPT-3.5」でスタートしたが、Azure OpenAI Serviceの対応にあわせて、3月からは「ChatGP

hetoheto 2023/06/30

プログラマーが減ってゆく…

リンク

画像生成AIに2度目の革命を起こした「ControlNet」 (1/4)

画像生成AI「StableDiffusion」の進化が止まりません。昨年8月にオープンソースとしてリリースされてから、世界中のプロアマ問わず多数の人たちが様々な研究成果を反映させ、毎日と言っていいほど新機能を誰かが発表するという状況が起きています。 StableDiffusion登場当初は、画像の品質のランダム性が高く、構図やポーズなどを指定できないという弱点を抱えていました。1枚の画像をもとに画像を生成する「i2i（image2image）」である程度コントロールすることはできても、「キャラクターに特定のポーズをとらせる」といったことは非常に難しかったんですね。その状況を一変させる新機能が今年2月に登場しました。その名も「ControlNet」。プロンプトによる制約を克服するための、とてつもないポテンシャルを持つ技術でした。Stable Diffusionに次ぐ「2度目の炸裂」と言って

hetoheto 2023/05/23

色々触ってるけど結局まだマシンパワー（札束）が必要なのと導入が色々めんどい。けど1年くらいでスマホやwebサービスで使えるようになると思う。そっからが本格的な民主化&混乱が起きるやろね

あとで読む

リンク

画像生成AI「Midjourney」でLINEスタンプを作ろう (1/3)

画像生成AIで好きなイラストを作るようになったら、ぜひやってみたいと思っていたのが今回取り上げるLINEスタンプの制作です。そもそももっと以前からやってみたいと思ってはいたのですが、1枚、1枚絵を描いて、色を付けて、それをスタンプの形にして……と考えているうちに腰が重くなってチャレンジせずにいました。ですが、AIの力を借りれば、いとも簡単に制作できることが分かったので、今回は実際に私がスタンプを作って申請、公開に至るまでの過程をご紹介しましょう。とはいっても、「Midjourney」を利用して作られたイラストは、現状、AIの学習素材の元となっているイラストや絵画データの取得先が開示されておらず、かなりグレーな状態になっています。本稿では、Midjourneyで生成したイラストをLINEスタンプの制作に利用しますが、あくまで個人利用を目的に制作していきたいと思います。 ※本記事は、5月3

hetoheto 2023/05/04

現時点では過学習気味で「そのまんま」の絵柄やポーズが出てくる可能性があるから、金儲けには使わないほうがいいと思うけどね。無償かつ趣味範囲ならOK

リンク

「AIトレパク」が問題に (1/3)

3DアバターのVRMのスクショアプリ「VRM Posing Desktop」を使いVRMで画像（左）を作成後、Stable DiffusionのWebUIでimg2imgを行ってイラスト風の画像（右）を生成したもの。（画像：筆者作成）画像生成AIの「img2img」が議論を起こしています。 img2imgとは、画像生成AIの機能の1つ「Image-to-Image」の略称。画像を読み込ませて、テキストで指定するプロンプトと合わせて画像生成すると、元となる画像のイメージを踏襲した画像を作ってくれるという機能です。たとえば3DアバターのVRMデータを読み込ませるだけでアニメ風の絵が生成されます。パラメーターの設定次第ですが、元のキャラクターの特徴もそのまま踏襲させることが可能です。元となる画像を用意することで、同じ顔つきのやポーズの画像が生成を容易にすることができるわけですね。この原理を

hetoheto 2023/01/25

img2imgを使ってないと言う証明が出来ない以上、表立って使うことは難しいと思うんだよな。2次エロみたいにアンダーグラウンドな感じで発展はするのかも

リンク

画像生成AIの激変は序の口に過ぎない (1/4)

画像生成AI「Stable Diffusion」がコンテンツ製作の技術革新を急速に促しているという話を「すさまじい勢いで世界を変えている画像生成AI」に書きました。あれから約2ヵ月が経ち、状況はさらに大きく変わってきています。 Novel AIソースコード流出事件最も影響が大きかったのは10月8日に起きたとされる「Novel AI」のソースコード流出事件です。どういった形でハッキングされたのかは明らかにされていませんが、流出したとされるコードはおそらく本物だという結論になっています。 Novel AIは10月3日にサービスが開始された画像生成AIサービス。Stable Diffusionや「Midjourney」と比べても圧倒的に高品質な日本アニメ風の画像出力ができることにより、日本やアジア圏で高い人気を得ています。 Googleトレンドの傾向を見てみても、日本ではNovelAIがリリー

hetoheto 2022/12/03

イラスト界隈が微妙に擁護されないのは、他人の著作物を利用して同人や支援サイトで儲けるのが普通になってしまってるから。著作権侵害だからと批判するならまず足元から…と言う話になってくる。客観的に見るとね

リンク

はてなブックマーク

タグ

ブックマーク / ascii.jp (22)

お知らせ

今週のはてなブックマーク数ランキング（2024年8月第1週）

月間はてなブックマーク数ランキング（2024年7月）

今週のはてなブックマーク数ランキング（2024年7月第4週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス