yag_aysのブックマーク - はてなブックマーク

StyleGAN＋CLIPによる汎用的な顔画像編集アプローチ
1.はじめに今まで、StyleGAN＋CLIPを使って顔画像をテキストで編集するアプローチには、テキストから潜在変数を最適化する Optimaization とテキスト毎に潜在変数の差分を事前学習する Mapper がありましたが、前者は時間が掛かり後者は汎用性に欠ける弱点がありました。今回ご紹介するのは、これらの弱点を改善した Global direction というアプローチです。＊この論文は、2021年3月に提出されました。 2.Global directionとは？まず、StyleGAN+CLIPを使って顔画像をテキストで編集する Mapper というアプローチをみてみましょう。左の元画像の潜在変数wをマッピングネットワークMに入力し差分△を求め、潜在変数w＋差分△をStyleGANに入力し、右の出力画像を得るネットワークを考えます。CLIP でテキストと出力画像の類似度を
yag_ays 2021/08/22
リンク
1

はてなブックマーク