タグ

画像と生成AIに関するsuperplayのブックマーク (2)

  • 動画生成AIについて:一番星はてのは目をゆっくり開き、踊れるか

    Krita の AI Diffusion プラグイン、SD のインターフェースとしてかなり良い。話題の LCM によるライブペイントも便利だし、イラストレーションツールだからレイヤーや選択ツールが使えるのが強い。すでに SD でできたことだが、こんな感じの変換が素早く、気持ちよく行える。https://t.co/bUPOZrKs1n pic.twitter.com/0hn8iMHHms — Naoto Yokoyama (@builtinnya) November 18, 2023 これらを ControlNet8 で入力して AnimateDiff を使えば済むと考えていたが、甘かった。 動画生成 AI に期待しているのは、この2枚の画像の間のフレームを説得力のある形で補間することである。しかし、7秒という長さでは、例えば次の動画1のようになってしまう。 動画1. 図1と図2を使い、パラ

    動画生成AIについて:一番星はてのは目をゆっくり開き、踊れるか
  • Google Research、1枚の人物画像からその人物が話す動画を生成するAI「VLOGGER」発表

    人物画像ごとにトレーニングする必要はなく、口元だけでなく、瞬きなどの顔全体の表情の変化や、上半身画像の場合、手のジェスチャーも表現できる。 80万個のアイデンティティの以前のデータセットより「1桁大きいく、動的なジェスチャーを備えた」新しいデータセット「MENTOR」に基づいてトレーニングした。 研究者らは論文で、VLOGGERは「身体化された会話エージェント」への一歩だと語る。「プレゼンテーション、教育、ナレーション、低帯域幅のオンライン通信用独立ソリューションとして、人間とコンピュータの対話のためのインタフェースとして」活用できるとしている。 動画はVLOGGERのページを参照されたい。 関連記事 YouTube、生成AIを使ったリアルな動画へのラベル付け義務化開始 YouTubeは、予告どおりクリエイターツールをアップデートし、生成AIで編集あるういは生成したリアルな動画へのラベル付

    Google Research、1枚の人物画像からその人物が話す動画を生成するAI「VLOGGER」発表
  • 1