17 oct 2022に出たImagicという技術について、ペーパーとソースを見比べながら説明します。
テキストプロンプトで画像を編集できるAI技術がよく話題になっていますが、それらは編集タイプが限定されていたり、複数の画像の入力が必要だったりするものがほとんどです。しかし、2022年10月17日にプレプリントサーバーのarXivで発表された「Imagic」は、画像の修正箇所を手動で指示したり別の画像を入力したりしなくても、1枚の画像とテキストプロンプトだけで複雑な画像の編集が可能とのことで、論文に掲載されている画像を見るだけでもそのすさまじさを実感することができます。 [2210.09276] Imagic: Text-Based Real Image Editing with Diffusion Models https://arxiv.org/abs/2210.09276 「Imagic」は、事前にトレーニングしたText to Image拡散モデルを利用しているため、複雑な非剛体(形
This week two new, but contrasting AI-driven graphics algorithms are offering novel ways for end users to make highly granular and effective changes to objects in photos. The first is Imagic, from Google Research, in association with Israel's Institute of Technology and Weizmann Institute of Science. Imagic offers text-conditioned, fine-grained editing of objects via the fine-tuning of diffusion m
Text-conditioned image editing has recently attracted considerable interest. However, most methods are currently either limited to specific editing types (e.g., object overlay, style transfer), or apply to synthetically generated images, or require multiple input images of a common object. In this paper we demonstrate, for the very first time, the ability to apply complex (e.g., non-rigid) text-gu