tsugiikimasu22のブックマーク - はてなブックマーク

Dream BoothをGoogle Colabで動かしてみる
1.はじめに今までテキストから画像生成するモデルは、テキストで指定して特定のオブジェクト（有名なものを除く）を画像生成することが困難でした。今回ご紹介するのは、テキストから画像を生成するモデルを、特定のオブジェクトの画像（３〜５枚程度）でファインチューニングすることによって、テキストで指定して特定のオブジェクトを画像生成できる Dream Booth という技術です。＊この論文は、2022.8に提出されました。 2.Dream Boothとは？下記がDream Boothのフロー図です。３～５枚の画像（Input Images）を使って、テキストから画像を生成するモデルを２ステップでファインチューニングします。第１ステップ（左図）はモデルの低解像度部分が対象です。ユニークな識別子を含むテキスト（”A[V]dog”）を入力したら入力画像（Input Images）を出力するように、
tsugiikimasu22 2023/02/18
リンク
1

はてなブックマーク