話題のオープンソース動画生成AI「CogVideo」をローカルマシンに超簡単インストールできたのです。
話題のオープンソース動画生成AI「CogVideo」をローカルマシンに超簡単インストールできたのです。
KLINGのサブスクリプションが開始されたばかりですが、同じ7月30日に早くもライバルが登場しました。これも中国の動画生成AIサービスで、「Vidu」というものです。といってもぽっと出ではなく、4月末にSoraクラスの動画生成AIとして発表。注目されていました。このViduが一般利用可能になったのです。 月額9.99ドルからのサブスクリプションプランが用意されていますが、無料ユーザーも1カ月で80クレジットが付与されます。半額セール中というところもKLINGと同じです。4秒の生成で4クレジット、アップスケールで4クレジット。Standard以上のユーザーが使える8秒生成とアップスケールはそれぞれ8クレジット必要です。 では実際に試してみます。 ■ViduのImage to Video、その実力は?まず、Image to Videoを試してみます。これには2つのモードがあり、入力した画像を最
「NoLang」は「○○の解説動画を作って」と入力するだけで解説動画を作成できるウェブアプリです。新たに、画面端にキャラクターを2体配置して対話形式で物事を解説する「ゆっくり解説」形式の動画が作成可能になったので、実際に試してみました。 【🔥重大発表】🐬NoLang 2.0をリリースしました!! ついに、「ゆっくり解説」形式の動画生成や縦型ショート動画の作成が可能に! 他にも動画の長さ指定、プロンプトによるスタイル制御、画像生成AIなど新機能が目白押し。 圧倒的進化を遂げたNoLangを是非お試しください!https://t.co/WcRBvKLhP1 pic.twitter.com/JOFN8t45KK— マーベリック|生成AI@NoLang (@sayhi2ai_jp) July 7, 2024 ・目次 ◆1:NoLangのアカウント登録 ◆2:「ゆっくり解説」形式の動画を作る設定
このサービスの有償プランに申し込んで使って、少しプロンプトのコツが掴めたので、お伝えしたいと思います。 ただ、自分が使った目的は映画などの映像制作ではなく、あくまでも静止画、それも人物を動かすことなのでご注意を。より具体的には、11年前に他界した妻の動く姿を見ることです。 ■フィルムカメラの写真を動かすまずやってみたのは、実際に撮った写真をDream Machineで動かすことです。 使った写真は、1978年から1987年にかけてフィルムカメラで撮影したもの。子供が生まれてビデオカメラ(ビデオ8mm)を買ったのが1987年なので、それまでは動いている映像がほとんどなかったのです。 例外として、学園祭の劇で主役を演じたものと、特捜最前線でエキストラをやったときのものは残っていますが。 多くの人にとって、1980年代以前の、動きのある映像は残っていないと思います(8mmフィルム愛好家がいる家庭
自分好みの続編だって作れる。AIが制作する動画配信サイトが登場2024.06.03 11:00 Oscar Gonzalez - Gizmodo US [原文] ( ヨコヤマコム ) いよいよ来てしまったAI動画ストリーミング。 サンフランシスコのスタートアップ企業Fable Studioが発表したのが、新たな動画配信サイト「Showrunner」です。 このサイトはNetflixのようなプラットフォームで、映像制作者やクリエイターによるテレビ番組が配信されます。Showrunnerの注目すべき点は、視聴者が追加のエピソードを観たいと思ったら、AI技術を活用して自身がエピソードを制作していくことができるということです。 現在はティザーサイトが公開中で、早期アクセスのウィッシュリストに登録できるようになっています。 AIのNetflixを目指す🚨ANNOUNCING SHOWRUNNER
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第49回目は、生成AI最新論文の概要5つを紹介します。 生成AI論文ピックアップ アニメの“中割り”を生成してアニメーションに仕上げる「ToonCrafter」 1枚の画像とモーションデータからダンス動画を生成するAIモデル「MusePose」 リアルタイムでストリーミング動画を変換するAIモデル「StreamV2V」 写真1枚から人物やキャラクターの話す動画を生成するモデル「V-Express」 人の手で塗った数枚の線画から、残りのアニメーションを自動彩色できるAIモデル アニメの“中割り”を生成してアニメーションに仕上げる「ToonCrafter」アニメーション制
動画編集アプリは数多くの種類が存在しますが、「動画に字幕だけを付けたい」といったちょっとした編集のために動画編集アプリをインストールするのは面倒です。「omniclip」はブラウザ上で動作するインストール不要の動画編集アプリとのことなので、実際にomniclipを使って動画に字幕を付ける編集をやってみました。 GitHub - omni-media/omniclip: Open source video editing web application https://github.com/omni-media/omniclip 今回は、以下の動画に字幕を追加してみます。 ビワマスを釣り上げる寸前に逃げられた - YouTube まず、以下のリンクをクリックしてomniclipを開きます。omniclipはChromeとEdgeに対応しているので、どちらかのブラウザを使ってアクセスしてくださ
私事ですが、骨折して2か月ほど半寝たきり&半引きこもり生活をしていました(動かな過ぎて痔になった)。なので連載以外は全く何もせず過ごしていたんですが、若干余裕が出てきたのでリハビリがてらnoteで好きなことを書きます で……久々にXを見て「おすすめ」タブに表示されていた裏垢女子を一度見たら、それからずっと出てくるようになってしまった。 裏垢女子というのは、一般的には性的な内容のポストや画像の投稿をあけすけに行い、会って性行為に及ぶのもやぶさかではない……みたいな女性ユーザーのことを指すが、体感では純粋に性的な出会いを求めている人は0.2%くらいではないかと思う。 残りの99.8%は ・「ここで連絡先交換してます♥」とか言われて詐欺の出会い系(会えることや資金譲渡をエサに入金を何度もせびられる)に誘導される ・DMで交通費やホテル代などの名目で「PayPayやAmazonギフト券をくれたら会
2024年4月時点で2億4800万人のチャンネル登録者を抱える世界一のYouTuber・MrBeastをはじめとした人気YouTuberやTikTokerは、「リテンション編集」と呼ばれる編集技術を用いています。しかし、こうした技術を用いた動画の人気はあくまで「バブル」であり、模倣者が非常に多くなったことで、そろそろ終わりの時期なのではないかという指摘が出ています。 MrBeast calls for slowing down video editing styles - The Washington Post https://www.washingtonpost.com/technology/2024/03/30/video-editing-mrbeast-retention/ MrBeastなどが用いている「リテンション編集」には、大音量の効果音や高速カット切り替え、点滅するエフェクト
生成AIの隆盛に伴い、ベクトル検索やベクトルデータベースが注目されています。 ベクトルについてより理解するために簡単なデモサービスを作ってみました。 この記事では作ったサービスをもとにベクトルについて説明し、後半では生成AIとベクトルの関連について紹介します。 つくったもの 「しもふりサーチ」 - お笑いコンビ「霜降り明星」のYouTubeチャンネル、「しもふりチューブ」の過去動画を検索できるサービスです。 このサービスには以下の2つの機能があります。 1. 文章での動画検索 文章で動画を検索する 「粗品さんがクイズを出題する回」 や 「せいやさんがギターを弾く回」 など、自然言語で動画を検索できます。 2. 関連動画レコメンド 内容の近い動画をレコメンドする 動画を選ぶと、過去動画の中から内容の近い動画をレコメンドします。 これらの機能はベクトル検索で実現されています。詳細を説明していき
ジェンダーの不平等が問題なのでしょうか? スペインのアルカラ大学(UAH)で行われた研究により、動画配信サイトTwitchの配信者を男女別で分析したところ、女性配信者は積極的に体の露出を行い、配信のポルノ化を起こしている傾向が示されました。 一方で研究で調べられたサンプルのうち、男性配信者が性的なアピールをしている例は1%未満となっていました。 研究者たちは収益を得る方法として自己を性的な対象として使用する傾向に警鐘を鳴らしています。 自由な表現の場だった動画配信サイトに何が起きているのでしょうか? 研究内容の詳細は2024年2月15日に『Humanities and Social Sciences Communications』にて公表されています。
人物画像ごとにトレーニングする必要はなく、口元だけでなく、瞬きなどの顔全体の表情の変化や、上半身画像の場合、手のジェスチャーも表現できる。 80万個のアイデンティティの以前のデータセットより「1桁大きいく、動的なジェスチャーを備えた」新しいデータセット「MENTOR」に基づいてトレーニングした。 研究者らは論文で、VLOGGERは「身体化された会話エージェント」への一歩だと語る。「プレゼンテーション、教育、ナレーション、低帯域幅のオンライン通信用独立ソリューションとして、人間とコンピュータの対話のためのインタフェースとして」活用できるとしている。 動画はVLOGGERのページを参照されたい。 関連記事 YouTube、生成AIを使ったリアルな動画へのラベル付け義務化開始 YouTubeは、予告どおりクリエイターツールをアップデートし、生成AIで編集あるういは生成したリアルな動画へのラベル付
OpenAIは2月15日(現地時間)、テキストから最大1分間の動画を生成できる動画生成AIモデル「Sora」を大量のデモ動画と共に発表した。複数のキャラクター、特定の種類の動き、被写体と背景の正確な詳細を含む複雑なシーンを生成することができるという。 プロンプトから破綻のない動画を生成 Introducing Sora, our text-to-video model. Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W Prompt: “Beautiful, snowy… pic.twitter.com
もう全部OpenAIでいいんじゃないかな はじめに 月間技術革新です。 ということで、昨日OpenAIから発表された新しい動画生成AI「Sora」が非常に話題となっていますね。 圧倒的な一貫性の保持と1分間に及ぶ長時間動画が生成可能という事で、現状の動画生成技術を圧倒的に凌駕する性能を持っているようです。 在野エンジニアの小手先テクニックなど一笑に付すような圧倒的性能を Soraの凄さは色んなエンジニアやインフルエンサーがたくさん語っているのでそちらを見てもらうとして、この記事ではSoraを構成する各技術について簡単に解説していければと思います。 Soraの技術構成 論文が公開されているわけではないですが、OpenAIが要素技術の解説ページを公開してくれているため、そのページを参考にしていきます。 原文を見たい方はこちらからどうぞ 全体構成 Soraは以下の技術要素で構成されているとのこと
GitリポジトリプラットフォームのGitLabは、社内で行われたZoom会議をYouTubeに公開しています。会議の内容は専門的で不特定多数に見せるためのものではないため、本来であればこうしたZoom会議動画の再生数は少なくなるものですが、動画の中には再生数が数万回を突破しているものも存在します。これは、GitLabのZoom会議動画を使って「仕事をしているふり」をする人が多いからだと、衛星通信会社・AstranisのチーフスタッフでX(旧Twitter)ユーザーのクリスチャン・ケイル氏が明かしました。 So GitLab posts their internal Zoom call recordings on YouTube, and some have HUNDREDS OF THOUSANDS of views... Because people use them to preten
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く