RAGは、LLMの生成能力を検索結果から得られる知識によって拡張する技術のことです。 LLMは、ChatGPTなどの膨大な量のテキストデータでトレーニングされた文章を生成するAIです。 テキストを生成することで、ユーザーからの質問や指示に答えることができます。 しかしLLMは、トレーニングデータに含まれていない知識や情報を必要とする質問に対しては、正確な回答を生成できません。 代表的なのはChatGPTに、2023年4月以降のデータがないことが挙げられます。 RAGがなければ、LLMに今日の天気を聞いても回答できません。 また、専門分野や固有名詞などには弱いところがあります。 これを解決するのがRAGです。 RAGはLLMの能力を活用して、関連情報を検索し、その結果を基に新たなテキストを生成します。 RAGの特徴は、単に既存の情報を再構成するのではなく、新たな文脈で情報を統合し、より有用な