[B! AI][動画] tyosuke2011のブックマーク

動画生成AI、革命の兆し「Stable Diffusion」級の衝撃再び (1/5)

アリババグループの通義研究所が2月にオープンモデルとして公開した動画生成モデル「Wan 2.1」の性能がめちゃめちゃ高いことがわかってきました。一貫性が高く、また、柔軟性も高く、LoRAといった追加学習データとも組み合わせても、素直にデータを反映するとの評価が高まっています。ユーザーが技術開発に関わることで、多数の新しい表現の可能性を模索する動きが登場しつつあります。ローカル環境で動かす動画AIでは、商用クラウド並の水準の動画が作れないという常識がひっくり返され、動画生成AIにStable Diffusion登場時に近いようなインパクトをもたらしつつあります。 ※記事配信先の設定によっては図版や動画等が正しく表示されないことがあります。その場合はASCII.jpをご覧ください圧倒的に性能が高い「Wan 2.1」の衝撃 ▲ファンタジー風の戦車を動かしている動画 Wan 2.1の性能の高さを

tyosuke2011 2025/03/31

リンク

はじめてAIに感動したかもしれん

youtube徘徊してたらおススメされた動画【総集編】AIでクロノトリガーのオープニングからエンディングまで再現してみた (Chrono Trigger AI generated movie) https://www.youtube.com/watch?v=gu10UJlvNJo （またAIの粗製乱造クソ動画かよ）と思いながらも（そういやクロノトリガー30周年ってホッテントリで見たな）などと思い、また、（AIのくせに結構尺長いし40万も再生されてんのすごいな）とちょっとだけ興味を惹かれたのでついタップしてしまった。想像を超えてきた。ちゃんとキャラがカッコいくてかわしいくて理想的な実写キャストになってて、映像表現もまあ割と破綻してるところ多いけどアクションとかに目をつむれば許容範囲だし、セリフ[AI音声]は声色豊富で演技もギリ許せるレベルだし、なにより音楽[本家音源無断使用[こ

tyosuke2011 2025/03/13

リンク

【AIアニメ】ComfyUIでAnimateDiffをはじめよう！｜Baku

※当noteで掲載しているワークフローについては各記事公開時点のComfyUI環境で動作を確認しています。その後のComfyUI/カスタムノードのアップデートにより最新の環境では不具合が生じる可能性があるので、あらかじめご了承ください。このnoteは、いま注目されているAI動画生成ツール「AnimateDiff」のハウツーをまとめた初心者ガイドです。「AnimateDiff」は2023年7月に公開されたオープンソースの技術で、誰でも無償で利用することができます。AnimateDiffについては以下の記事が参考になります。導入編1. ComfyUI のすすめ「AnimateDiff」は、単体では細かなコントロールが難しいため、現時点では以下のパッケージのどれかを選んで使うことが多いです。 AnimateDiff-CLI-Prompt-Travel コマンドラインでAnimateDiff

tyosuke2011 2025/01/15

リンク

元旦から廃業宣言・自分が過去数十年やってきた仕事のスタイルは生成AIによって成立しなくなる／ Blog - 2025/01/01｜CreativeEdge Vlog

元旦から廃業宣言・自分が過去数十年やってきた仕事のスタイルは生成AIによって成立しなくなる／ Blog - 2025/01/01 2025年元旦 2016年11月からスタートした「AIクリエイティブ」は8年、生成AIに注力してから2年経ちました。昨年は本業のInstructional Designを「0」、生成AIを「100」にして取り組んできましたが、2025年も継続していきます。ただ、「映画を撮らない映画監督のように」今後も表舞台ではInstructional Designerを名乗ります。廃業宣言みたいなものですが、生成AIをビジネスにすることだけは避けないといけませんので（※生成AIは最大限に活用するけど生成AIのビジネスはしない）、複合的かつ多層的に将来を決めていきたいと思います。「AIクリエイティブ」活動は8年、生成AIの取り組みは2年経過4月から開始した非公式のライブ配

tyosuke2011 2025/01/06

いや廃業しませんが

AI
動画

リンク

女子生徒30人の偽ポルノ、作ったのは同級生　AI使えば数秒で…：朝日新聞デジタル

AI（人工知能）を使って偽の性的な画像や動画を作る「ディープフェイクポルノ」。身近な人をターゲットにした被害が広がっている。　米ニュージャージー州の高校では昨年10月、少なくとも女子生徒30人の「裸…

tyosuke2011 2024/12/22

リンク

3DモデリングにAI革命の兆し　1枚のイラストから3Dデータが完成 (1/4)

動画生成AIの発展により、非常に面白い方向性が生まれてきています。最新の動画生成技術と3D技術を組み合わせることで、たった1枚の絵から、3Dデータを作れるようになる可能性が出てきているんですね。これは将来のゲーム開発や映像制作のあり方を激変させる可能性があります。 ※記事配信先の設定によっては図版や動画等が正しく表示されないことがあります。その場合はASCII.jpをご覧ください動画生成AI「Runway」新機能がきっかけまず、この動画を見てください。Stable Diffusionを使って作成した1枚の画像を、いくつかの手順を実施することで、3Dモデルとして扱えることに成功している様子です。こうしたことが実現できるようになったのは、動画生成AIサービス「Runway」に11月2日に追加された新機能「カメラコントロール機能（Advanced Camera Control）」のためです

tyosuke2011 2024/11/25

あ！AIが進化した！

リンク

動画と音声ガッチャンコでなんでもAI口パク「sync.」。リップシンクはVideo to Videoの時代に突入した（CloseBox） | テクノエッジ TechnoEdge

tyosuke2011 2024/08/13

AI
動画

リンク

ゆっくり解説動画を一瞬で作れるAIアプリ「NoLang」の使い方まとめ

「NoLang」は「○○の解説動画を作って」と入力するだけで解説動画を作成できるウェブアプリです。新たに、画面端にキャラクターを2体配置して対話形式で物事を解説する「ゆっくり解説」形式の動画が作成可能になったので、実際に試してみました。【🔥重大発表】🐬NoLang 2.0をリリースしました！！ついに、「ゆっくり解説」形式の動画生成や縦型ショート動画の作成が可能に！他にも動画の長さ指定、プロンプトによるスタイル制御、画像生成AIなど新機能が目白押し。圧倒的進化を遂げたNoLangを是非お試しください！https://t.co/WcRBvKLhP1 pic.twitter.com/JOFN8t45KK— マーベリック|生成AI@NoLang (@sayhi2ai_jp) July 7, 2024 ・目次 ◆1：NoLangのアカウント登録 ◆2：「ゆっくり解説」形式の動画を作る設定

tyosuke2011 2024/07/17

リンク

動画生成AIについて：一番星はてのは目をゆっくり開き、踊れるか

動画生成AIについて：一番星はてのは目をゆっくり開き、踊れるかお嬢様系 AI はてなブックマーカーである一番星はてのちゃんのファンアート生成の記事を書いてから、すでに1年以上が経過した。はてのちゃん当人からもブックマークされ、大変満足したことを覚えている1。はてのちゃんは1年以上経った現在も毎日元気に活動しており、喜ばしい限りである。 2023年3月当時と現在2を比較すると、LLM を含む生成 AI 技術は当然のように進歩している3。動画生成 AI については、2023年7月に AnimateDiff がリリースされ、ローカル環境でも（比較的）簡単に（比較的）高度に制御された（比較的）高品質な動画が生成できるようになった。当時、筆者は仕事で動画生成 AI の商業的利用の可能性について検討する機会があり、AnimateDiff を含む生成 AI 技術を使って、どの程度のコストでかつどの

tyosuke2011 2024/07/03

リンク

もうSoraは不要なのか。動画生成AIの新基準、Luma AI「Dream Machine」をサブスクしてわかった「ハリー・ポッターに出てくるような魔法」の使いこなし術（CloseBox） | テクノエッジ TechnoEdge

このサービスの有償プランに申し込んで使って、少しプロンプトのコツが掴めたので、お伝えしたいと思います。ただ、自分が使った目的は映画などの映像制作ではなく、あくまでも静止画、それも人物を動かすことなのでご注意を。より具体的には、11年前に他界した妻の動く姿を見ることです。 ■フィルムカメラの写真を動かすまずやってみたのは、実際に撮った写真をDream Machineで動かすことです。使った写真は、1978年から1987年にかけてフィルムカメラで撮影したもの。子供が生まれてビデオカメラ（ビデオ8mm）を買ったのが1987年なので、それまでは動いている映像がほとんどなかったのです。例外として、学園祭の劇で主役を演じたものと、特捜最前線でエキストラをやったときのものは残っていますが。多くの人にとって、1980年代以前の、動きのある映像は残っていないと思います（8mmフィルム愛好家がいる家庭

tyosuke2011 2024/06/15

リンク

【AI動画生成】Sora 要素技術解説

もう全部OpenAIでいいんじゃないかなはじめに月間技術革新です。ということで、昨日OpenAIから発表された新しい動画生成AI「Sora」が非常に話題となっていますね。圧倒的な一貫性の保持と1分間に及ぶ長時間動画が生成可能という事で、現状の動画生成技術を圧倒的に凌駕する性能を持っているようです。在野エンジニアの小手先テクニックなど一笑に付すような圧倒的性能を Soraの凄さは色んなエンジニアやインフルエンサーがたくさん語っているのでそちらを見てもらうとして、この記事ではSoraを構成する各技術について簡単に解説していければと思います。 Soraの技術構成論文が公開されているわけではないですが、OpenAIが要素技術の解説ページを公開してくれているため、そのページを参考にしていきます。原文を見たい方はこちらからどうぞ全体構成 Soraは以下の技術要素で構成されているとのこと

tyosuke2011 2024/02/18

リンク

高精細な動画を生み出すOpenAIの新ツール「Sora」は、生成AIを新たな次元へと押し上げる | WIRED.jp

tyosuke2011 2024/02/16

リンク

【特集】 ChatGPTにストーリーを書いてもらい、生成AIで短編映像を作成する方法

tyosuke2011 2024/01/11

AI
動画

リンク

AI動画が簡単に作れる「AnimateDiff」を試したらやりがい爆上がり。カスタム学習したあの子が自然に動いてるよ（CloseBox） | テクノエッジ TechnoEdge

筆者も話題になった直後から試そうとしていたのですが、自分ではうまくいかず悶々としていたところ、Memeplexでできるようになったので、そのインプレッションをお届けします。 AnimateDiffの基本的な動作は、静止画を作成できるAI作画モデルを使って、一貫性のある短いアニメーションGIFを生成するというもの。Stable Diffusion 1.5、2.0といった標準的なものだけでなく、その上にカスタム学習（ファインチューニング）したモデルにも対応できるというのが特徴です。同様の技術としては「Tune-A-Video」があったのですが、一貫性が乏しかったために使いどころがなかなか難しいものでした。筆者は現在、MemeplexとStable Diffusion WebUI上に、妻の写真を学習させたAIモデル（Checkpoint）を作成して使っていて「異世界とりちゃん」という名の下に日

tyosuke2011 2023/08/21

リンク

AIボイスチェンジャー「Seiren Voice」が高速化＆システム要件緩和で声変換動画の制作が高速・快適に！｜ニコニコインフォ

AIボイスチェンジャー「Seiren Voice」が高速化＆システム要件緩和で声変換動画の制作が高速・快適に！ 2023年6月2日（金）より、ドワンゴが開発した声変換ソフトウェアシリーズ「Seiren Voice（セイレンボイス）」の新しい音声ライブラリを販売開始しました。 Seiren Voiceの新しい音声ライブラリは、これまでのものよりも変換速度が上がり、要求スペックが下がり、お求めやすい価格になり、より動画制作に使いやすくなりました。 Seiren Voiceとは？「Seiren Voice」は、自分の声をキャラクターの声に変換する声変換ソフトウェアです。変換品質を重視しており、リアルタイムな声変換ではなく、いったん録音した声を変換するため、生配信よりも動画制作用途に適しています。テキスト情報から音声合成を行うソフトでは指定が難しい「間の取り方」や「抑揚」などについて、声を入力と

tyosuke2011 2023/07/30

ちょっとお高いので手を出しづらい

リンク

Stability AI、テキストをアニメーションに変換する「Stable Animation SDK」発表

「Stable Diffusion」を開発したAI企業のStability AIは米国時間5月11日、テキストをアニメーションに変換するツール「Stable Animation SDK」を発表した。開発者やアーティストがStable Diffusionモデルを使って、アニメーションを生成できるようにするものだ。 Stable Animation SDKでは、テキストのみ、テキストと初期画像、テキストと初期動画という3種類の入力から、動画を生成できる。一部のユーザーは既に、生成したアニメーションをTwitterに投稿している。 here is my first try pic.twitter.com/aaFBF3VwFK — datajules (@j_vicente_go) May 12, 2023 「DALL・E」や「Bing Image Creator」とは異なり、このモデルはウェブ

tyosuke2011 2023/05/15

リンク

【誰でも簡単】AIで画像を動画化。原稿を読ませてみました！（リップシンク）

こんにちは、画像生成AIのプロンプトを研究しているじょじお（＠jojio‗illust）です。この記事ではAI画像を好きなテキストやレコード済み音声をしゃべらせることができるサービスを紹介します。

tyosuke2011 2023/04/28

リンク

マイクロソフト、「GitHub Copilot X」をVisual Studioに搭載したデモ動画を公開。コードを自然言語で解説、デバッグ、ユニットテストの生成など

マイクロソフト、「GitHub Copilot X」をVisual Studioに搭載したデモ動画を公開。コードを自然言語で解説、デバッグ、ユニットテストの生成など GitHubは先月、GTP-4をベースに「GitHub Copilot」の機能を大幅に強化した「GitHub Copilot X」を発表し、Visual Studio Codeのコードエディタ内でAIと対話しながらプログラミングが可能になる様子を公開しました。参考：［速報］「GitHub Copilot X」発表、GPT-4ベースで大幅強化。AIにバグの調査依頼と修正案を指示、ドキュメントを学習し回答もそして先週、マイクロソフトは同社の統合開発環境であるVisual StudioでGitHub Copilot Xを用いてプログラミングを行うデモ動画「GitHub Copilot X in Visual Studio」を公開

tyosuke2011 2023/04/03

リンク

Phenaki

A model for generating videos from text, with prompts that can change over time, and videos that can be as long as multiple minutes. Read Paper The water is magical Prompts used: A photorealistic teddy bear is swimming in the ocean at San Francisco The teddy bear goes under water The teddy bear keeps swimming under the water with colorful fishes A panda bear is swimming under water Chilling on the

tyosuke2011 2023/02/08

リンク

はてなブックマーク

タグ

関連タグで絞り込む (24)

AIと動画に関するtyosuke2011のブックマーク (19)

お知らせ

今週のはてなブックマーク数ランキング（2025年4月第3週）

今週のはてなブックマーク数ランキング（2025年4月第2週）

今週のはてなブックマーク数ランキング（2025年4月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス