システム創造事業部の河村です。 今回はJavaの検索エンジンSolrで”カスタム”辞書を利用するというお話です。 とある案件で、既存システムで利用していた形態素解析用の辞書をSolrに移植することになりました。 IPADIC形式の辞書がベースということでSolrでも問題なく利用できるだろうと思っていたのですが、予想以上に多くの問題がありました。また、色々調べた結果、現在「Solrで形態素解析する際の辞書」という観点で非常に勉強になったので、この投稿にまとめてみたいと思います。 Solrで形態素解析をする場合 Solrで形態素解析をするのも随分楽になりました。一昔前はSenをセットアップして利用していましたが、今ではKuromojiという形態素解析エンジンがSolrの”text_ja”フィールドにデフォルトで設定されているので、Solrをインストールしてすぐに管理画面からKuromoji