CPU、メモリ、SSDは? ありがとうございます。生成AIのマシンにはグラフィックスカードが重要だということがよく分かりました。CPUは何を選んだらいいんでしょう? 生成AIは、基本的にGPU(グラフィックスカード)側で計算するので、CPUはあまり影響しません。ただ、最終的に映像にするとかゲームに使うとかならば、それぞれのゲームエンジンが要求するスペックに合わせたほうがいいですね。例えば、Unreal Engine4というゲームエンジンで使うならAMDのRyzenのほうがいいです。
筆者も話題になった直後から試そうとしていたのですが、自分ではうまくいかず悶々としていたところ、Memeplexでできるようになったので、そのインプレッションをお届けします。 AnimateDiffの基本的な動作は、静止画を作成できるAI作画モデルを使って、一貫性のある短いアニメーションGIFを生成するというもの。Stable Diffusion 1.5、2.0といった標準的なものだけでなく、その上にカスタム学習(ファインチューニング)したモデルにも対応できるというのが特徴です。同様の技術としては「Tune-A-Video」があったのですが、一貫性が乏しかったために使いどころがなかなか難しいものでした。 筆者は現在、MemeplexとStable Diffusion WebUI上に、妻の写真を学習させたAIモデル(Checkpoint)を作成して使っていて「異世界とりちゃん」という名の下に日
AI画像生成サービスを提供するAI Picasso(東京都港区)は8月10日、フリー素材サイト「いらすとや」風のイラストを生成できる「AIいらすとや」の正式サービスを始めた。これまで公開していたβ版では、生成した画像の用途がSNSへの投稿のみに限られていた。今後は、同社の有料サブスクリプション(月額1480円)に登録すれば、無制限に画像を生成し、全てクレジットなしで商用利用できる。 AIいらすとやは、いらすとやを運営するみふねたかしさんと提携の上、2022年12月に発表したサービス。「Stabel Diffusion」などと同じくテキストから画像を生成できる他、画像をアップロードし、生成の参考にしてもらうこともできる。縦横比や背景透過の有無も指定できる。無料でも、月に20枚の制限つきだが画像の生成が可能。
「NVIDIA 生成 AI Day 2023 Summer」で、Stability AI Japan株式会社のJerry Chi氏が登壇し、「Stable Diffusionの活用法と事例」の講演を行った。主に画像生成AI「Stable Diffusion」の機能紹介やビジネス活用の解説や動画デモだったが、その内容は「画像生成AIはこんなことまでできるようになったのか」と、全編が驚きの連続だった。 「Stable Diffusion」は画像生成AIブームを巻き起こすきっかけになったアプリケーション(ソリューション)で、最大の特徴は、絵やイラストを描いたり描画すること。写真のようなフォトリアリスティックやアニメ風に生成することもできる。 Stability AI Japan株式会社は日本支社として、研究開発やコミュニティ活動、ビジネス活動に注力している。ただし、海外のモデルを日本でそのまま使
Stability AIは6月26日、画像生成AIの最新モデル「Stable Diffusion XL」を発表しました(「画像生成AI『Stable Diffusion』最高性能の新モデル『SDXL 0.9』一般的なPCで実行可能」)。パラメーター数がオリジナルのStable Diffusionの9億から23億へと大幅に拡大され、描写力が飛躍的に上昇したモデルです。正式版のSDXL 1.0が7月18日に公開予定とあり、あらためて注目されています。ベータ版にあたるSDXL 0.9は先行して、有料課金サービス「DreamStudio」と、Discordでの公開を開始していました。Discordでは1人無料で1回出力可能で、いまもリアルタイムで生成画像が見える状態です。その後SDXL 0.9は研究用に公開されて、ダウンロード可能になりました。 大きな違いは「2回生成する」こと SDXLがこれまで
英Stability AIは7月13日(現地時間)、ラフなスケッチにテキストのプロンプトを添えると高度な画像に変換する新ツール「Stable Doodle」を公開した。ログインしなくても何度か試せる。 Stability AIが3月に買収したInit MLのプラットフォーム「ClipDrop」で利用できる。用意されたキャンパスにマウスやスタイラスでスケッチを描き、その下のプロンプト枠に例えば「猫、3Dで」などと(英語で)入力すると、候補画像が3枚生成される。 Stability AIは、「AIツールに精通しているかどうかに関係なく、基本的な描画スキルとオンラインアクセスがあれば誰でも数秒で高品質のオリジナル画像を生成できる」としている。「デザイナーやイラストレーターなどのプロフェッショナルな方々が、貴重な時間をよりクリエイティブな方面に有効活用し、作業効率を最大化するためのユーザーフレンド
百聞は一見に如かず。これってAI生成グラビア?AI画像生成に興味を持ったのは去年の年末頃だろうか。Twitterを眺めていると「どうやって撮った(作った)んだ?」と言う画像がたまに載っていたので調べると、Stable Diffusion Web UI (AUTOMATIC1111版)だった。 元々グラビアを撮っていたこともあり、あまり撮らなくなってもグラビア好きなのには違いなく、試したくなったのは言うまでもない。 AI生成画像は大きく分けて2種類あり、一つはイラスト系、もう一つはリアル系。筆者が興味を持ったのは後者。どこまで実写に迫れるのかがその興味の対象だ。百聞は一見に如かず。扉の写真はAI生成画像。現時点でこの程度の写りは容易にこなす。 とは言え、実際の撮影もそうなのだが、グラビア写真は数百枚撮ってカメラマンがある程度セレクトし納品したものが、納品先で更に絞られ、出版社などで更に絞り込
「AIグラビア・AI美女を簡単に生成したい」 「量産型であるAI顔の画像は作りたくない」 「BRAV5をよく使っている」 このような場合には、BRAV6がオススメです。 この記事ではBRAV6について解説しています。 本記事の内容 BRAV6とは?BRAV6の利用方法BRAV6の動作確認 それでは、上記に沿って解説していきます。 BRAV6とは? BRAV6が、2023年7月7日にリリースされました。 BRAV6とは、BRAのバージョン6(V6)です。 BRAは、Beautiful Realistic Asiansの略称になります。 BRAV6を使うと、次のような美女(AI美女)の画像を簡単に生成できます。 サンプルは、モデル開発者のTwitterから確認できます。 https://twitter.com/PleaseBanKai このBRAシリーズは、今ではかなり有名なモデルになっていま
マイクロソフトは2022年10月、PowerPointのデザイン機能を切り出し、クラウドベースで「Microsoft Designer」を公開した。当初は利用するのに待機リストへ申請する必要があったが、現在はMicrosoftアカウントを持っていれば誰でも無料で利用できるようになっている。 OpenAIの画像生成AI「DALL·E 2」を利用し、イメージする素材を瞬時に生成してくれるので、クリエイティブの時間が圧倒的に短縮できる。 例えば、イベントの告知に入れるイメージ画像やSNSに投稿する画像などは、そこまで手をかけるのもコスパが悪い。そんな時は、「Microsoft Designer」でサクッと作ってしまおう。 Microsoft Designerの使い方 「Microsoft Designer」のウェブサイトを開いたら、「New design」をクリック。「Describe the
リアルタイムでおっさんから美女の映像を作り出すAI実験が、「す、すごすぎる!」「ライブでしたらだまされるレベル」と話題になっています。 す、すげーーー! 実験をしているのは、3DアーティストのHirokazu Yokoharaさん(@Yokohara_h)。Twitterに変換前後の映像を並べた動画を投稿しました。 その結果は驚くべきもの。動きが少々カクカクしているものの、Web会議を通じてであれば本物と信じてしまいそうなレベルです。 動作はもちろん、表情も追従。さらに顔だけでなく体形まで女性らしくなっています。髪形は、黒いTシャツをかぶることでロングヘアに変換させました。Tシャツの柄などがときどき変わってしまうので、よく見ていればおかしいと思えますが、ボーッと見ていたらわからないでしょう。ましてや、中身がおっさんなんて絶対に思えない! 黒いTシャツをかぶり、ロングヘアーを再現させました
画像生成AI「StableDiffusion」の進化が止まりません。昨年8月にオープンソースとしてリリースされてから、世界中のプロアマ問わず多数の人たちが様々な研究成果を反映させ、毎日と言っていいほど新機能を誰かが発表するという状況が起きています。 StableDiffusion登場当初は、画像の品質のランダム性が高く、構図やポーズなどを指定できないという弱点を抱えていました。1枚の画像をもとに画像を生成する「i2i(image2image)」である程度コントロールすることはできても、「キャラクターに特定のポーズをとらせる」といったことは非常に難しかったんですね。 その状況を一変させる新機能が今年2月に登場しました。その名も「ControlNet」。プロンプトによる制約を克服するための、とてつもないポテンシャルを持つ技術でした。Stable Diffusionに次ぐ「2度目の炸裂」と言って
無料の作画AIモデル「Stable Diffusion」(ステーブル・ディフュージョン)が8月23日に公開されてから、1週間分の記憶はほぼない。次に気がついたのは、1週間後の8月30日の午前3時だった。 プログラミングに集中するといつもこうなる。その後まで含めて十数日間、ほとんどベッドで寝た記憶がない。 振り返れば8月23日、たまたま夜中に目が覚めてしまったのがまずかった。その直後にStable Diffusionが全世界に向けて公開され、どれほどの実力なのか確かめてやろうと、試しにプログラミング言語Pythonのコンソール(端末)を起動してしまった。 2時間後、朝日が昇る頃には、「日本語で言葉を入力すると、自動的に英語に翻訳して投入する」無名のWebサービスを立ち上げていた。 そこから怒濤(どとう)の日々が始まった。 「Stable Diffusion」にハマって身の上に起こったこと
をしていきます。 先日某所で情報をチェックしていたところ、LoRAモデルの画期的な活用方法を考案した方が登場して大変話題になっていました。なぜそんなに話題になったのかというと、その方が作成したLoRAモデルをうまく使えばイラストに圧倒的なディテールを追加できるからです。 ここではそのLoRAモデルである「flat LoRA」の概要や使い方をご紹介しますね。
こんにちは!逆瀬川( https://twitter.com/gyakuse )です! 今日はプレゼンの自動生成をやっていきたいと思います! 作成したスライド参考: 概要 GPT-3を用いて任意の目的からプレゼンの骨子を作り、 Diffusion Modelを用いてスライドを説明するような画像を生成します。 海外ではスライド作成系のサービスがどかどか出てるので、見てみると楽しいです。 https://elucile.lubis.co.jp/ https://www.beautiful.ai/ https://www.slidesai.io/ https://beta.tome.app/ Colab 注意 今回のシステムはOpenAIのAPIキー、Google CloudのプロジェクトIDを必要とします 処理毎にCloud StorageのBucketを作成します 不要になり次第こちらから削
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く