言葉を入力すると、AIがあなただけの怪談を紡ぎ出します。 目を閉じることでしか聴けない怪談ジェネレーター。 キーワードを入力します
言葉を入力すると、AIがあなただけの怪談を紡ぎ出します。 目を閉じることでしか聴けない怪談ジェネレーター。 キーワードを入力します
ComfyUIは画像生成AIや動画生成AIをPCでローカル実行できるアプリです。NVIDIAや各種AIモデルの開発企業と協力して「新モデルの即日対応」や「NVIDIA製GPUやAMD製GPUへの最適化」も行っており、記事作成時点で画像や動画の生成を始めるなら第一候補としてオススメできるアプリとなっています。数年前まではインストール時にコマンド操作が必要だったり複雑なノード操作が必要だったりしましたが、アップデートによってクリック操作だけでインストールできるようになっており、UIを簡略化する仕組みも導入されました。ゲーミングPCなどのグラフィックボード搭載PCなら簡単に画像生成を始められるので、最初の一歩の手助けとなるようにインストールと最初の生成までの手順をまとめてみました。 ComfyUI | Generate video, images, 3D, audio with AI https
扇動的な記事タイトルだけど、AI技術の全否定やAI賛成反対者を貶す意図はないです。 ウェブ魚拓やarchive.isなどの複製をしないでもらいたい。あとこれだけは許せないから言っておくんだけど、個人に対して冷やかしや一蹴したくなったり、奇異な目で見るんだったらブラウザバックしてくれ。これ以上辟易させるな。 ちょっと前からSora2というのを知って使うようになって、夜中から朝までの時間を、自分のフェチな動画をSora2で生成させて性欲を満たす事に自制が効かなくなり、睡眠時間が5時間や2時間だったりして食事も疎かになってしまった。 普段は自慰にかける時間も1日の内に1回で1~2時間だったのに、3時間だったり5~6時間になり、ついに9時間もズリネタ生成含む自慰をし続けて時間を浪費する日が出てしまった。 捨てアカウントも十数個も作ったりして、生成回数をグレーな方法で延ばしたりして、自慰にこんなに執
2022年8月、Stability AIがテキストから画像を生成するAIモデル「Stable Diffusion 1.0」を公開。これまでテキスト中心だったAI分野に大きな衝撃を与えた。高性能なサーバーを使わずとも、個人のPC上で高品質な画像を生成できるという事実は、多くのクリエイターに強いインパクトを残した。 ただし当時は、要求されるマシンスペックが高く、環境構築にも技術的な知識が必要だった。そのため「面白そうだが難しそう」と感じて、実際に導入するまでには至らなかった人も少なくない。 しかし、その状況は次第に改善していく。2023年7月にStability AIが公開した「Stable Diffusion XL(SDXL)1.0」によって、1024×1024ドットの高解像度画像生成が実現。12GBのVRAMを搭載したGPU(RTX 4070クラスなど)があれば、安定して実用的に利用できる
悩み:30時間かかっていたMV制作を、なんとかしたかった「AIを使えば、もっと早くMVを作れるはず」──そう思っていたのに、 気づけばいつも朝になっている。 1本のミュージックビデオ(MV)を完成させるのに、平気で30時間くらいかかっていました。 もちろん、こだわり始めれば時間はいくらあっても足りません。 でも、もう少しサクッと、でもクオリティは妥協せずに作れないか── そんな思いをずっと抱えていました。 そこで今回、噂のAI動画生成ツール 「Sora 2」 を本格的に導入してみることにしました。 試したこと:Sora2 AIを使ったMV制作フロー今回試した、実際の制作手順はこんな感じです。 参考にした記事はこちら。 🪶 STEP1:プロンプト作成まず、MVの元になる歌詞をChatGPTに読み込ませて、 映像のイメージを伝えるプロンプトを生成します。 このときのコツは、プロンプトの最後に
まずは、このプロンプトで「何ができるのか」をサクッとお見せします。 1️⃣Googleスライド完成までの流れ①Geminiに原稿を渡すプロンプトをセットしたGemに、スライド化したい元ネタを渡します。 文字起こし・PDF・動画など、AIが解析できるデータなら何でもOK! ②GoogleスライドでGASを開くコードをまるごとコピーし、空のGoogleスライドから「拡張機能」→「Apps Script」を開きます。 ③コードを実行するコピーしたコードを貼り付けて保存 → 「実行」をクリック。 ④スライド完成!Googleスライド に戻ると…この通り。 スライドショーGIF: すべて純粋なオブジェクト(テキストや図形)なので、自由に編集可能。 もちろん、好きな画像を挿入することもできます。 なんと…「スピーカーノート」まで自動で生成してくれます。 2️⃣はじめにきっかけは「スライド生成AI、会社
アリババの動画生成モデル「Wan2.2 14B」i2vを使い、明日来子さん(この連載によく登場する作例キャラクター)に銃を構えさせた動画の一部(筆者作成) 7月28日に公開された中国・アリババの動画生成AIモデル「Wan2.2」がすさまじい性能を発揮しています。ローカルPC環境で利用できるオープンモデルとして公開されましたが、ヘタな商用AIクラウドサービスを超えていると感じさせるほど、高品質なAI動画が生成可能です。2月リリースの「Wan2.1」でも高い評価を得ていましたが、それを遥かに超えており、業界を席巻しそうな雰囲気を感じました。 ※記事配信先の設定によっては図版や動画等が正しく表示されないことがあります。その場合はASCII.jpをご覧ください 実写もアニメも高性能 Wan2.2の性能の高さは触れば触るほどわかってきます。カップ麺、箸、麺など、複数のオブジェクトが関わるため、画像や
3ヶ月経って、いくつか新しいモデルが登場したことでごっそり事情が変わりました。 ChatGPT Pro使ってましたが解約しました。o3が登場したらまた考えます。一時期解約していたGemini Advanced(Google AI Oneプレミアム?)を契約しなおしました。Claudeの年契約をしたんですがすこーし後悔しています。 追記: Gemini 2.5 Pro は今までのGemini シリーズとは明確に違うコメントとかでGeminiアレルギーの人が多そうなので追記します。実際のところ僕もそうでしたよ。過去のGeminiは、特に1.5 Proが論外なくらいハルシネーションも多く馬鹿で、使い物にならないおもちゃでした。それは事実です。2.0 Proで状況が変わり始めたものの実験モデルが続いてて、結局コイツの真価がよくわからんってなってました。 Gemini 2.5 Proを触ったことがな
やっぱり、「CURSOR」を使わないのは損だ 1ヵ月ほど前に「いま文章を書くのに「CURSOR」を使わないのは損だ」という記事を書いた。CURSORは、プログラムを書くためのコードエディタだが、それを日本語の文章を書くために活用しようというのが、その記事と今回の原稿のテーマである。 つまり、この原稿は前回の記事のアップデート版であり続編でもあるが、はじめて読む方にもわかるように書いている。執筆のきっかけは、「あの記事を読んでCURSORを使いはじめました」と何人かの知人から声をかけられたことだ。そして、 「めちゃめちゃ文章を書くのが楽になった」 という声をいくつも聞いたからだ。また、JEPA(日本電子出版協会)でCURSORのセミナーをやらせてもらうことになった。4月4日にオンラインで開催された「遠藤諭氏『AIと共に書く』 CURSOR入門」である。 そこで、セミナーのために用意したスライ
この画像生成機能は最近、スタジオジブリ風のアニメスタイルの画像を生成する使い方で話題になっている。利用の殺到を受け、Altman氏はXに「GPUが溶けている」と投稿した。 筆者もこの機能を試し、この記事のトップ画像を作成した。ChatGPTのアプリは接続切れを起こすなど少し手間取ったが、最終的には5分足らずでChatGPTのロゴがニューヨーク上空を飛んでいる画像を生成した。 AI開発競争が激化 OpenAIが画像生成機能を使ってChatGPTのさらなる普及を狙う動きは、AI開発企業の間で激化している競争の新たな展開にすぎない。米国や中国などの国における多くのスタートアップに加え、Apple、Anthropic、Microsoft、そして1週間前に最新のAIモデル「Gemini 2.5」を発表したGoogleなどが競い合っている。ChatGPTは約5億人の週間ユーザーを有するとみられるが、他
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く