![https://twitter.com/shuzonarita/status/1572947933712220161](https://cdn-ak-scissors.b.st-hatena.com/image/square/933126d88b63e1885075a611ccda23384dc3a058/height=288;version=1;width=512/https%3A%2F%2Fpbs.twimg.com%2Fprofile_images%2F1236268583941894146%2FZ14rK7Q9.jpg)
Stable Diffusionがオープンソースで公開されてちょうど1ヶ月が立ちました。OpenAIがDall-E2をリリースしたのが4月。こういう異次元なリソースを使ってモデルを作れるのはごく限られたプレーヤーだけと思い込んでいたものが、若干十数人のチームがMidjourneyをリリースしたのが7月。一連の騒ぎがここ半年程度の出来事で、1ヶ月前に深津さんも予見していた「世界変革」が目の前で怒涛の勢いで進行しています。 このブログも書いた瞬間に古くなるだと思うけど、この文化的特異点とも言える1ヶ月に起こったことを振り返ってみたいと思います。それにしても手書き文字の生成に感動していた2015年から比べるとずいぶん遠いところまで来ましたね。DataRobotでも「AIの民主化」を掲げて様々な企業のAI活用を推進していたけれど、今起こっている変化を見ているとそのスピード感に愕然とします。 少し宣
英字新聞社ジャパンタイムズ、スタートアップメディア・テッククランチでの記者経験を経て、ダイヤモンド社のスタートアップ担当記者に。最近はフードテックやモビリティ領域に注目している。趣味はギターやシンセサイザーだが総じて下手。2020年7月よりダイヤモンド社「DIAMOND SIGNAL」記者。 From DIAMOND SIGNAL スタートアップやDX(デジタルトランスフォーメーション)を進める大企業など、テクノロジーを武器に新たな産業を生み出さんとする「挑戦者」。彼ら・彼女にフォーカスして情報を届ける媒体「DIAMOND SIGNAL」から、オススメの記事を転載します。※DIAMOND SIGNALは2024年1月をもって、ダイヤモンド・オンラインと統合いたしました。すべての記事は本連載からお読みいただけます。 バックナンバー一覧 本記事では、インタビュアーを担当したTHE GUILD・
SNSなどで大きな話題を呼んでいる高精度な画像生成AI「Stable Diffusion」は、入力したテキストを基に画像を生成するため、「呪文」とも呼ばれる適切な文字列を考案することが重要です。しかし、思い描いている理想はあるものの、どんな文字列を入力すればいいのかわからない人も多いはず。そこで、Stable Diffusionで特定の構図や雰囲気を再現するために使える文字列を、画像例を見ながら調べられるウェブサイト「The Ai Art」を使ってみました。 The Ai Art - AI, Art, and everything in between https://www.the-ai-art.com/modifiers 「The Ai Art」にアクセスすると、「Angles(アングル)」の指定に使える文字列が画像と共に一覧表示されました。 「Extreme close-up ang
ホーム ブログ 人工知能(AI)、ビッグデータ法務 Midjourney、Stable Diffusion、mimicなどの画像自動生成AIと著作権|知… はじめに Midjourney、Stable Diffusion、mimicなど、コンテンツ(画像)自動生成AIに関する話題で持ちきりですね。それぞれのサービスの内容については今更言うまでもないのですがMidjourney、Stable Diffusionは「文章(呪文)を入力するとAIが自動で画像を生成してくれる画像自動生成AI」、mimicは「特定の描き手のイラストを学習させることで、描き手の個性が反映されたイラストを自動生成できるAIを作成できるサービス」です(サービスリリース後すぐ盛大に炎上してサービス停止しちゃいましたが)。 で、この手の画像自動生成AIのようなコンテンツ自動生成AIですが、著作権法的に問題になる論点は大体決ま
はじめに 以前、お絵描きAIことMidjourneyの紹介をしましたが、 それから色々とMidjourneyを試していたら だいぶ良い感じにアニメ調の背景作れるようになったんではないだろうか🤔 廃墟,海,火山,流星群#midjourney pic.twitter.com/Yt1u3eiJyt— カン@ゲームクリエイター(Unity/VR/Steam/Switch) (@Kan_Kikuchi) 2022年8月25日 細かいオブジェクトは指定せず、色だけ強く指定するのも有りだな🤔#midjourney pic.twitter.com/sBjXnkJIjQ— カン@ゲームクリエイター(Unity/VR/Steam/Switch) (@Kan_Kikuchi) 2022年8月27日 月$30の高速作成分は余裕で使い切り、合計1300枚以上の画像を描いてもらってました……! やはり100%思い
やりたいこと この前の記事で、 jtnoske.hateblo.jp 元絵そのままimg2imgにかけると しかし背景含めて全体が変わってしまうのは不都合が出できそう、画像の指定箇所のみ再度描き直すなんてことができるとたいへん便利になりますなぁ… Photoshopとかで切り抜いてやればうまくいったりするんだろうか? というアイデアが浮かんだので実際にやってみることにした。 元の絵の一部、今回は顔の部分だけを抜き出して、そこだけimg2imgにかけたらどういう結果が得られるか。 やったこと(1) この絵の顔を GIMPで顔だけ抜き出しまして(投げ縄ツールとかウン年ぶりに使った というかGIMP自体ウン年ぶりに使った…) 透過PNGで保存、prompt は前回、前々回とまったく同じでimg2imgをかけます、と次のようなエラーが… RuntimeError: Sizes of tensors
画像生成AI「Stable Diffusion」は、「森で遊ぶクマ」「アイスクリームを食べる人間」といった文章を入力するだけで文章に沿った画像を出力してくれるAIです。そんなStable Diffusionには文章と共に「元となる画像」を入力することで出力画像の精度を向上させられるモード「img2img」が存在。このimg2imgを駆使して簡単なラフ画像から高品質なイラストを生成する手順について、ソフトウェアエンジニア兼フォトグラファーのアンディ・サレルノ氏が解説しています。 4.2 Gigabytes, or: How to Draw Anything https://andys.page/posts/how-to-draw/ Stable Diffusionに「森で遊ぶクマ」といった指示を与えた場合、「構図がイメージ通りではない」「夏の森ではなく、冬の森がいい」といったように、イメージ
画像生成AI「Stable Diffusion」は入力したキーワードに沿って画像を出力してくれるAIで、簡単なお絵かきとキーワードを合わせて意図した画像を生成したり、「この画像っぽい○○」といった指示でイメージを形にできたりと、さまざまな機能や手法が生み出されています。そんなStable Diffusionについて、「画像を学習するAIは、ウェブ上のどのような画像を学習しているのか?」という疑問を解明するために、23億枚のデータセットから1200万枚を抜粋して集計した調査結果を、技術者・ブロガーのアンディ・バイオ氏が公開しています。 Exploring 12 Million of the 2.3 Billion Images Used to Train Stable Diffusion's Image Generator - Waxy.org https://waxy.org/2022/0
イラスト生成AI「mimic」は8月30日、ベータ版に寄せられた意見を踏まえ、ベータ版の提供を全て停止すると発表しましました。主な理由として、「ベータ版では不正利用(※)を防ぐ仕組みが不十分であると考えたため」と説明しています。 ※利用者が著作権を保持していないイラストを、著作権者の許諾なくアップロードすること(あくまで利用規約違反という意味で、現行の著作権法ではAIサービスに学習させるための利用は著作権侵害とはなりません) イラスト生成AI「mimic」は、イラストレーターが自分のイラストを学習させることで、自分の絵柄のイラストを生成することができるというAIサービス。しかし8月29日にサービスが公開されると「他人のイラストを取り込んで生成したイラストを悪用するケースが発生するのでは」と懸念する声が続出。一応、ガイドラインでは他人のイラストをアップロードしてはいけないことになっていました
Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 イスラエルのTel-Aviv UniversityとNVIDIAの研究チームが開発した「An Image is Worth One Word: Personalizing Text-to-Image Generation using Textual Inversion」は、ある概念を新しい単語(論文ではnew pseudo-wordと表現している)に置き換え、その新しい単語を一部に用いた文章を画像生成AIの入力に使用するシステムだ。 指定したキャラクターや物、絵などが持つ概念(形、質感、雰囲気、構成、デザインなど)を単語に圧縮し、入力テキストに活用することでその概念に沿ったさまざまな画像を
画像生成AI「Stable Diffusion」を使ったLINEのAIチャットbotサービス「お絵描きばりぐっどくん」が8月28日に公開された。LINE上で文章を送ることで、AIが画像を生成する。英語の他、日本語にも対応している。九州工業大学情報工学部の4年生の西野颯真さん(@nishino_0719)が作成した。 LINEでbotを「友だち登録」することで利用可能。1日10枚まで画像を生成できる。生成した画像の著作権はStable Diffusionと同様、パブリックドメインとしている。西野さんは「Stable Diffusionを触る上で環境構築のハードルの高さへの課題を感じていて、そこを誰でも気軽に触れるLINEを使って解消できないかなと思った」と作成した経緯を話す。 リクエスト通りに画像を生成するコツについては「明言はできないが、人物の生成は苦手だけど風景の生成は得意などの特徴を把
前置きこんにちはchiliと申します。 852話さんのkawaiiのツイート以来、kawaiiの作成を頑張っています。 深夜に一般公開されたstable Difusionでの画面映えを意識したキャラクターのイラストの出力が、プロンプトの練度を上げたところ中々にえぐい。の画像まとめ。 AIartが今後どうなっていくのか楽しみすぎてワクワクする。すげーなあ。 pic.twitter.com/TQGhtBOQvA — 852話 (@8co28) August 23, 2022 一回リアルな絵に逃げていたのですがようやく安定してきたので、どのように安定化させたのかをまとめます。一点注意として今は様々なバリエーションが出た方が面白そうなのでpromptの公開は行いません。今回は考え方のみを紹介します。 まず現在生成できている絵は以下のようなものです。
昨日の続き。 jtnoske.hateblo.jp やはり構図を決めるにはimg2imgや、と思い立つ promptとキャンバス縦横比とかで構図のコントロールに挑戦したけど、いやこりゃ無理だわやっぱ構図を自分で決めるならimg2imgでいろいろ指定してやらないといかんのだろな、ということでimg2imgを導入する。 導入 導入方法は各所で上がっていますが、自分は↓のコードをコピペして、 github.com ↓ のコードを参考に実行をしました。 www.12-technology.com Hな方々は↓を(トラバ含めて)参照し、safety_checkerを切りましょう。変更箇所はStableDiffusionPipelineとほとんど同じです。 anond.hatelabo.jp 絵が描けないので img2img(1): 全身立ち絵 絵を用意しよう、なんだけどどう用意するか。 まず思いつい
テクノロジースタートアップのデジタルレシピは、「画像生成AIに絵を描いてもらうためのテキスト作成支援AI」を公開しました。無料で利用できます。 AI画像生成ツール用にテキストを生成ジェネレーター ユーザーが入力したテキストをもとに画像を生成するとして話題の「画像生成AI」ですが、デジタルレシピは「どのような文章を入力したらいいのか分からない」というSNSでの声が多かったことからジェネレーターを開発したとのこと。 テキストボックスに日本語で文章を入力(推奨は全角500文字以上)、絵のスタイルを指定しボタンを押すと画像生成AIに読み込ませるためのテキストが生成されます。 「AI画像生成ツール用にテキストを生成ジェネレーター」を使って筆者が「Midjourney」で生成。テキストは日本語で「2人の少年が、草原でサッカーボールを蹴って遊んでいます。空は晴れていて気持ちよさそうな天気です。よく見ると
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く