エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
PostgreSQLでハイブリッド検索 vector × BM25 を RRF で統合
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
PostgreSQLでハイブリッド検索 vector × BM25 を RRF で統合
はじめに 最も一般的な RDB の一つである PostgreSQL を使い、ベクトル検索と BM25 検索を組み合わせた... はじめに 最も一般的な RDB の一つである PostgreSQL を使い、ベクトル検索と BM25 検索を組み合わせたハイブリッド検索を実装する方法を紹介します。 RAG(Retrieval-Augmented Generation)において、検索精度を上げるために「意味で探すベクトル検索」と「単語で探すキーワード検索」を併用する手法は非常に有効です。 使用する技術スタック Python Gemini API: テキストのベクトル化 Sudachi: 日本語の形態素解析(分かち書き) pgvector: PostgreSQL でのベクトル検索 pg_textsearch: PostgreSQL での BM25 検索 RRF (Reciprocal Rank Fusion): 検索結果の統合アルゴリズム DB コンテナの作成 まず、検証用の環境を準備しましょう。 ベクトル検索には pgve

