前書き ChatGPTなどの大規模言語モデル(LLM)では,Hallucinationが課題の一つです. 医療など内容の正確性が求められる分野では特に重要な課題で,LLMに外部データベースから正確な情報を与えた上で, 生成を行うRetrieval augmentation Generation (RAG)が対策方法の一つになります. RAGでは,関連する情報を正確に検索する必要があり,文章の正確な意味を反映した埋め込み表現を得ることができる文埋め込みモデルが重要です. そこで,医療分野の日本語の文章に対して,文埋め込みモデルをSemantic Textual Similarity(STS)タスクで比較・検証してみます. 1. 方法 1.1. 検証対象のモデル とりあえず目に付いた以下の5つのモデルを使います. OpenAI/text-embedding-ada-002以外はすべてHuggi