本記事は「KDDIアジャイル開発センター(KAG) Advent Calendar 2023」、11日目の記事です。 はじめに こんにちは、KDDIアジャイル開発センターのはしもと(仮名)です。 LLM大好き!LLM大好き! LLMのマルチモーダル対応 LLMの開発競争は凄まじく、流暢に多言語を話したかと思えば、最近では画像や動画、音声などの入力に対応した マルチモーダルモデル が続々と発表されています。 トップランナーOpenAIの「GPT-4 Vision」だけでなく、最近ではGoogleが「Gemini」を発表し、その高い性能と汎用性にワクワクした記憶も新しいです。 (内容についてはSNSなどでも色々語られていますが、一個人としては純粋にその将来性に期待したいと感じました) マルチモーダルRAG LLM の代表的なユースケースのひとつにチャットボットがあります。 更にその高度化で、モ