「Google Colab」で「Visual ChatGPT」を試したので、まとめました。 1. Visual ChatGPT「Visual ChatGPT」は、「ChatGPT」と一連の「Visual Foundation Models」を接続することで、チャットで画像生成を行うパッケージになります。 具体的には、LangChainのToolとして、以下の機能を利用できるようにしています。 ・Stable Diffusion ・ControlNet ・InstructPix2Pix ・CLIPSeg ・BLIP 詳しくは、論文「Visual ChatGPT: Talking, Drawing and Editing with Visual Foundation Models」を参照。 2. Colabでの実行Google Colabでの実行手順は、次のとおりです。 (1) パッケージのク