タグ

ブックマーク / zenn.dev/mattyamonaca (3)

  • 入力線画を全く変えずに画像生成AIに色塗りさせる方法

    タイトル通り、入力線画を(基的には)1pixelも変えずに画像生成AIに色塗りをさせる方法について解説していきます。 題に入る前に そもそも画像生成AIによる色塗り(着彩)について知らない方向けに、既存技術AIに色塗りをさせるとはどのような事を指すか?またどのような課題があるか?について一度整理します。 画像生成AIによる着彩 テキストから画像を生成できるという事で一躍有名になった画像生成AIですが、テキストだけでは生成したい画像を詳細に指示することが困難であるという課題を抱えていました。 そこで、テキストと比較してより具体的に生成したい画像を指示する方法として。ControlNetを用いた画像とテキストを入力して新たな画像を生成する手法が現れます。 この応用として、色塗りがされていない線画と指示テキストを入力することで、入力した線画に対し色を塗った状態の画像を生成するという方法が存

    入力線画を全く変えずに画像生成AIに色塗りさせる方法
  • 【次世代動画生成】Open-Sora徹底解説【OSS版Sora?】

    いずれも16フレームで学習が行われているため、長時間の動画生成はできないようです(大体2秒程度) 実際に生成してみた結果 プロンプト Waves are crashing on the sandy beach. The ocean glows orange in the setting sun, and the sun is about to set on the horizon. モデル Resolution Data #iterations Batch Size GPU days (H800) URL アーキテクチャ さて、このOpen-Soraですがどのような構造になっているのでしょうか? SoraはDiTを使っているなどある程度の情報が公開されていますが、全てのアーキテクチャが公開されているわけではありません。 そのため、Open-Soraも完全にSoraと同じというわけではなくあ

    【次世代動画生成】Open-Sora徹底解説【OSS版Sora?】
  • Diffusersを用いたControlNetの学習方法解説

    はじめに 自作ControlNetの学習に挑戦してうまくいったので、改めてやりかたを整理します。 作ったControlNetはこちら この記事で話す内容 学習環境の構築 Diffusersで利用可能なDatasetフォーマットの作り方 Diffusersを用いたControlNetの学習手順 この記事で話さない内容 ControlNetとは何か Diffusersとは何か 学習データの作り方 学習手順 基的には、DiffusersのControlNetの学習例に沿って進めていきます。 環境構築 今回はDiffusersのexampleに格納されているControlNetの学習コードをそのまま使うため、まずはDiffusersをGithubリポジトリからCloneしてきます。 git clone https://github.com/huggingface/diffusers.git また

    Diffusersを用いたControlNetの学習方法解説
  • 1