エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
Lucene 8 の Top-k クエリプロセッシング最適化(2) MaxScoreアルゴリズム編 | by mocobeta | Medium
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
Lucene 8 の Top-k クエリプロセッシング最適化(2) MaxScoreアルゴリズム編 | by mocobeta | Medium
Lucene 8 の Top-k クエリプロセッシング最適化(1) 導入編 の続きです。本エントリでは,OR クエリの性... Lucene 8 の Top-k クエリプロセッシング最適化(1) 導入編 の続きです。本エントリでは,OR クエリの性能上の問題点を説明してから,それを解決するアルゴリズムである MaxScore およびその改良版 について紹介します。 同じ内容は 転置インデックスとTop k-query に詳しいので併せて参照してください。 転置インデックス走査と Disjunction (OR) クエリの問題点 (Lucene/Solr/Elasticsearch のアーキテクチャを少しでも学んだことがある方はご存知のように,)Lucene は転置インデックス方式を採用しており,検索語 (term) ごとにドキュメント IDのリスト (posting list) を持っています。このとき,ドキュメント ID の並べ方はいくつか考えられますが,圧縮性能の良さなどから ID 昇順で並べることが多く,Lu