エントリーの編集

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
事例紹介 - PGroongaで異体字検索をいい感じに! - 2023-11-14 - ククログ
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
事例紹介 - PGroongaで異体字検索をいい感じに! - 2023-11-14 - ククログ
PGroongaのサポートサービスを担当している堀本です。 トピックスでも触れていますが、国文学研究資料館... PGroongaのサポートサービスを担当している堀本です。 トピックスでも触れていますが、国文学研究資料館様向けのサポートサービスで、国文学研究資料館様が運用している国書DBの改良を行いました。 どんな問題があって、どんな改良をしたかについては、トピックスに記載のある動画で紹介していますので、そちらを見ていただければと思います。 この記事では、動画で紹介しきれなかった問題点、解決策の詳細について記載します。 問題点の詳細 まずは、問題点からです。 国書DBの問題点は、異体字の検索が遅いことでした。 なぜ遅いかは動画では、「インデックスを使っていないから」と解説しています。 では、なぜインデックスを使っていなかった(使えなかった)のでしょうか? デフォルトのPostgreSQLで素朴に全文検索をする場合、 LIKE 演算子と % を使った中間一致になります。 つまり、 SELECT * FR