クリニック検索では、Ngramと形態素解析を併用することにより検索結果のヒット数を担保しつつ検索ノイズの増加による悪影響をスコアソートにより軽微なものに抑えています。 施術メニューピックアップのための全文検索では、検索ノイズが少ない形態素解析のみを利用しています。 美容クリニックでの検索における問題 形態素解析では、辞書に含まれている単語の集合に基づいて形態素が認識されます。 Sudachiの辞書において美容医療の専門用語が網羅されておらず、問題が発生します。 形態素解析で専門用語がカバーされていない問題 上記の表の通り、形態素解析では検索漏れが多いです。 例えば、「ダーマペン」は美容医療では人気な単語ですが、Sudachiに搭載されているデフォルトの辞書ではカバーされていないので、形態素として抽出されません。 形態素解析で期待通り認識・分割されない問題 「二重」が「フタエ」でなく「ニジュ
![「ホットペッパービューティー」美容クリニックでのElasticsearchのユーザー辞書登録による検索改善](https://cdn-ak-scissors.b.st-hatena.com/image/square/2b00ce017bf8f02fe55cc152d9adf4b1bceafb9a/height=288;version=1;width=512/https%3A%2F%2Fblog.recruit.co.jp%2Frls%2F2021-04-22-hpbc-search-dictionary%2Fimg%2Fsudachi_logo.png)