村田らむ @rumrumrumrum ライター、イラストレーター、漫画家です。 最新の著作は 『人怖 2 人間の深淵なる闇に触れた瞬間』『人怖』(竹書房) 『非会社員の知られざる稼ぎ方』(光文社) 『禁断の現場に行ってきた』『こじき大百科』『ホームレス消滅』『ゴミ屋敷奮闘記』『樹海考』丸山ゴンザレスさんとの共著『危険地帯潜入調査報告書』など。 youtube.com/channel/UC9KcU…
画像生成AI「Stable Diffusion」は、「森で遊ぶクマ」「アイスクリームを食べる人間」といった文章を入力するだけで文章に沿った画像を出力してくれるAIです。そんなStable Diffusionには文章と共に「元となる画像」を入力することで出力画像の精度を向上させられるモード「img2img」が存在。このimg2imgを駆使して簡単なラフ画像から高品質なイラストを生成する手順について、ソフトウェアエンジニア兼フォトグラファーのアンディ・サレルノ氏が解説しています。 4.2 Gigabytes, or: How to Draw Anything https://andys.page/posts/how-to-draw/ Stable Diffusionに「森で遊ぶクマ」といった指示を与えた場合、「構図がイメージ通りではない」「夏の森ではなく、冬の森がいい」といったように、イメージ
画像生成AI「Stable Diffusion」を使ったLINEのAIチャットbotサービス「お絵描きばりぐっどくん」が8月28日に公開された。LINE上で文章を送ることで、AIが画像を生成する。英語の他、日本語にも対応している。九州工業大学情報工学部の4年生の西野颯真さん(@nishino_0719)が作成した。 LINEでbotを「友だち登録」することで利用可能。1日10枚まで画像を生成できる。生成した画像の著作権はStable Diffusionと同様、パブリックドメインとしている。西野さんは「Stable Diffusionを触る上で環境構築のハードルの高さへの課題を感じていて、そこを誰でも気軽に触れるLINEを使って解消できないかなと思った」と作成した経緯を話す。 リクエスト通りに画像を生成するコツについては「明言はできないが、人物の生成は苦手だけど風景の生成は得意などの特徴を把
「Stable Diffusion」で遊んでいたところ、定期的に謎の画像に差し変えられてしまう皆さん
852話さんには遠く及ばない... Gallery a samurai girl with japanese school uniform, japanese anime style A girl with wolf ear on silver hair, combat toon graphic, arknights, dolls frontline, pixiv girl's frontlineのつもりがdollsになってた...。その影響か人形っぽい雰囲気になっている。 concept idea of a kawaii girl with animal ear on her head, fantasy idle costume, equlip magic wand, beautiful face, thick coating painting, flower blooming, bir
AIが画像を自動生成してくれる「Stable Diffusion」がすごい。これを使ったサービス「DreamStudio」は1枚6秒ほどで画像を生成してくれて早いが、無料枠を超えて使うには課金が必要になる。 Google Colabという、Pythonの実行環境を提供してくれるサービス上でStable Diffusionを動かせるそうだ。お金はかからない。1枚の画像生成にかかるのは30秒ほど。その方法は以下で解説されている。 Google Colab で はじめる Stable Diffusion v1.4|npaka|note 自分でもやってみて、今は無事にStable Diffusionを使えるようになっている。しかしGoogle Colabを使うのも初めてだったので上の記事だけだと詰まるところもあった。ここではそれを解説したいと思う。 ライセンスの確認 Hugging Faceのトー
2022年8月23日に無料公開された画像生成AI「Stable Diffusion」は、「ボールで遊ぶ猫」「森の中を走る犬」といった指示を与えると指示通りの画像を出力してくれます。Stable Diffusionはデモページで画像生成を試せる他、NVIDIA製GPUを搭載したマシンを用いてローカル環境で実行することも可能です。しかし、デモページは待ち時間が長く、NVIDIA製GPUは所持していない人も多いはず。Googleが提供しているPython実行環境「Colaboratory」を利用すれば、NVIDIA製GPUを所持していなくともStable Diffusionを待ち時間なしで実行する環境を無料で整えられるので、実際に環境を構築する手順や画像を生成する手順を詳しくまとめてみました。 Stable Diffusion with 🧨 Diffusers https://huggingf
前提として、Stable Diffusionでエロ画像を出そうとしてもsafety checkerという機能が入っており、センシティブな画像を出そうとすると黒塗りになる。 (Stable DiffusionのSaaSであるDream Studioはぼかしだが、多分別の技術) https://github.com/huggingface/diffusers/releases/tag/v0.2.3 そこでGoogle Colabでちゃちゃっと環境を作り、なおかつNSFWを回避する。 1. 下記のリンクでノートを開く https://colab.research.google.com/github/huggingface/notebooks/blob/main/diffusers/stable_diffusion.ipynb 2. 下記の箇所を書き換える vvvvvvvvvvvvvvvvvv f
まとめ 【新世代コミPo】「Midjouney」にマンガを描かせてみるテストで出来上がった超美麗フルカラー漫画「サイバーパン.. 「作れるかも」といっている暇があったら「作ってしまってから考えればいい」という精神、実にクリエイターらしくて良い 130101 pv 510 631 users 324 中本アイアール@水平思考ユニットうみがめ部 @air_nakamoto Midjourneyさんに、 TRPGセッションの背景画像をご担当いただきました。 17世紀大航海時代シナリオということで、 背景の用意をどうしたものかと思っておりましたが、 短納期にもかかわらず、快く引き受けてくださいました。 ほんと、女神様やで。 pic.twitter.com/SlCBnEgprA リンク TRPG JAPAN Midjourneyの使い方|TRPGの背景や挿絵に使える画像をAIが自動生成サービスの解説
やればやるほど呪術化する、AI画像錬成について。 以下は、その道の専門家にはメッチャ怒られるかもしれない、雑なロジックと制御講座。 いちおうメジャーなサービスでは、共通して動作するノウハウ(DALL-E2, MidJourney, StableEiffusion, DiscoDiffusion, crayon, dall-e mini 他)。 雑に理解する画像AIのしくみ対話型のAIにとって、呪文プロンプトとは画像錬成の方向性ベクトルを定めるものにすぎない。 たとえば、以下は「I love apple」で錬成された画像の例である。どうにも、ふわっとしたものが出てくる I Love Apple「Apple」という方向性ベクトルは、「リンゴ」「青リンゴ」と「アップルコンピューター(旧レインボーロゴ」「アップルコンピュータ(新ロゴ)」など、複数の可能性を同時に持つからだ。 つまり、「Apple」
オープンAIは、文章から画像を生成する「DALL-E 2」のベータ版を100万人に提供する。一部有料化し、生成した画像の商用利用も可能となる。 by Will Douglas Heaven2022.08.01 17 29 サンフランシスコに拠点を置くAI企業のオープンAI(OpenAI)は、画像生成プログラム「DALL-E(ダリー) 2」のベータ版 について、提供待ちリストに登録済みの100万人へ提供する。拡大に伴い、一部有料化に踏み切る。 今年4月に招待制で提供が始まって以来、およそ10万人がDALL-E 2を試用している。そして今、オープンAIは、DALL-E 2を有料サービス化するにあたり、その10倍の人数に門戸を開く。 オープンAIの製品・パートナーシップ担当副社長のピーター・ウェリンダーは、「(DALL-E 2は)GPT-3のときよりもはるかに大きな、私たちが予想した以上の関心を
■1.サイドバーから「#newbies」チャンネルを1つ選択する ■2. 「/imagine」コマンドを使用する MidJourney Bot を使用するには、Bot チャンネルで Discord Slash Command を使用します(#newbies-1 など)。 「/imagine」と入力しすると、テキストにポップアップが表示されます。 プロンプトフィールドが表示され、MidJourney Botに生成させたいものを追加することができます。 スペースキー、タブキー、Enterキーを押してプロンプトフィールドを作成できます。 Botのスラッシュコマンドは、Botチャンネルでのみ動作します。/imagineと入力しても、#trial-supportのような通常のチャンネルでは機能しません。 プロンプト入力後、Enterキーを押すかメッセージを送信してください。これであなたのリクエストが
凸版印刷は2月16日、画像認識AIを活用して古文書に書かれた“くずし字”の解読を支援するツール「ふみのはゼミ」を開発したと発表した。オンラインで複数人による解読作業が可能で、解読精度は90%にも上るという。価格は月額7万円(税別、以下同)から。 くずし字は江戸時代以前に使用されていた文字の一種。凸版印刷は解読済みのくずし字の形を学習させた画像認識AIを生成。画像の文字を読み取ってテキストデータに変換するOCR(光学的文字認識)技術と組み合わせた。 古文書のスキャン画像からくずし字を指定すると、AIが自動的に解読する。目視による結果を再学習させることで、文字認識の精度を上げられるという。 解読した文字や単語へのコメント機能や、解読作業の参加者が交流できるチャット機能など共同作業機能も備える。
小猫遊りょう(たかにゃし・りょう) @jaguring1 毎日、数学をやっています。抽象度の高い数学が好きで、公理的集合論や数理論理学、圏論に興味があるけど、もっと具体的で実用的な数学も好きです。AI技術と、それがもたらす社会的影響についてよく考えていますが、基本的にテクノロジー全般の最新動向に興味があります。良さげな講義動画を見つけたら、ツイートするようにしてます。 小猫遊りょう(たかにゃし・りょう) @jaguring1 うおぉ、、新年早々、超激ヤバなニューラルネットをOpenAIが2つ発表してきた(DALL-EとCLIP)。視覚データとテキストの両方を用いたAIシステムで、DALL-Eは、テキストで説明すると、それっぽい画像を生成。こんなの創造性以外の何者でもない。テキスト+画像版GPT-3っぽい openai.com/blog/tags/mult… pic.twitter.com/
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く