話題のオープンソース動画生成AI「CogVideo」をローカルマシンに超簡単インストールできたのです。
話題のオープンソース動画生成AI「CogVideo」をローカルマシンに超簡単インストールできたのです。
10秒の歌声オーディオデータがあれば、本人そっくりのリアルタイム歌唱ができるという「Vocoflex」。ベータテスターの申し込みをしていたのですが、ついに試用できたので、そのファーストインプレッションをお届けします。
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。2024年初っ端の第27回目は、「礼儀は不要」「モデルに質問させる」「良い解答には報酬」など、大規模言語モデルの返答が向上する「プロンプト26の原則」をはじめとする5つの論文をお届けします。 生成AI論文ピックアップ複数の自律AIエージェントが過去の経験を共有して未知のタスクを処理するモデル「Experiential Co-Learning」 画像から動く3Dシーンを生成する新モデル「DreamGaussian4D」 大規模言語モデルの返答が向上する「プロンプト26の原則」が公開。「礼儀は不要」「モデルに質問させる」「良い解答には報酬」など 220以上の生成タスクが実
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第23回目は、AIアニメーションを次の段階に進ませる技術と大きな脚光を浴びた「Animate Anyone」、3D Gaussian Splattingを使った新しい3D応用技術など、生成AI最新論文の概要5つをお届けします。 生成AI論文ピックアップ画像内のキャラクターや写真内の人物を骨格動画に応じて動かせる「Animate Anyone」 アリババらが開発 話した言葉をリアルタイム翻訳できるシステムMeta「Seamless」 話し方や感情なども忠実に再現 リアルな動きを持つ高品質なアバターを生成するモデル「Animatable Gaussians」 写真から3D
先日ソニーが発表した新型プレイステーション5は、従来モデルより30%以上も小さく、18~24%軽くなったこともあり、一部では「PS5 Slim」と呼ぶ声もあります。
実は「@x」のアカウントは2007年からずっと、サンフランシスコを拠点とする写真家の Gene X Hwang氏が使用していました。しかし、7月25日にこの「@x」アカウントが非公開化されています。 この時点ではTwitter / XからHwang氏に何の通告もなかったものの、同氏は「連絡があれば喜んで話を聞く」「納得のいく提案があれば、喜んでアカウントを手放すつもりだ」と述べていました。 その後27日になって、@xアカウントがこのSNSの公式アカウントとして生まれ変わっているのが発見されています。 しかしHwang氏によると、X(Twitter)側はこのアカウントが「本質的に『X』の所有物だというメールを送ってきた」のみで、金銭的補償は提案も含め一切なかったとのこと。 Hwang氏いわく「起こると思っていたことが起こり、私はそれをただ受けいれた」。X(Twitter)側は「利用可能な希望
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く