はじめに 今までのRAGは、ドキュメントをチャンク化して検索インデックスに格納し、クエリに対して検索、推論を行う といった手法でした。 この場合、ドキュメントのチャンク単位で検索され推論に使うため、ドキュメン卜横断で複雑な関係性に対し推論することには向いていないように思います。 GraphDBは、ドキュメントをノード(頂点)とリレーション(頂点間の関係性)に変換し、ドキュメント内の要素間の関係性を持つDBです。 以前に、LlamaIndexをベースにNeo4jへのナレッジグラフ生成を試してみましたが、日本語だと精度が落ちて実用には耐えられなさそうでした。 今回は、MicrosoftResearchからGraphDBのソリューションがGitHubで公開されたので、そちらを試してみます。 GraphRagのGitHubリポジトリ https://github.com/microsoft/gra

