はじめに モチベーションとしては生成AI関連としてここ3~4ヶ月でRAG構成(Retrieval-Augmented Generation)の記事が目に止まるようになり、RAGによるメリット等概要は知ってるつもりでしたが、具体的な構成ってどうなるの?というのは、あやふやだったりしまして、、、調べるとベクトルDBが既に盛り上がってましたので、遅れてはマズイ!とおもいお勉強かねて記事にさせてもらいました。 RAGとは RAGは、大規模言語モデル(LLM)と外部検索システム(つまりDB)を組み合わせた設計パターンの1つで、LLM単体では回答するベースとなる知識が訓練データに依存しますが、RAGを用いることで、LLMはリアルタイムで外部の情報源にアクセスし、より正確な回答を生成することが可能になります。 また、以下は私のRAG構成イメージ図になりますが、RAG構成は後述するベクトルDBだけでなく、