PGroongaのサポートサービスを担当している堀本です。 トピックスでも触れていますが、国文学研究資料館様向けのサポートサービスで、国文学研究資料館様が運用している国書DBの改良を行いました。 どんな問題があって、どんな改良をしたかについては、トピックスに記載のある動画で紹介していますので、そちらを見ていただければと思います。 この記事では、動画で紹介しきれなかった問題点、解決策の詳細について記載します。 問題点の詳細 まずは、問題点からです。 国書DBの問題点は、異体字の検索が遅いことでした。 なぜ遅いかは動画では、「インデックスを使っていないから」と解説しています。 では、なぜインデックスを使っていなかった(使えなかった)のでしょうか? デフォルトのPostgreSQLで素朴に全文検索をする場合、 LIKE 演算子と % を使った中間一致になります。 つまり、 SELECT * FR