形態素解析による検索とは? 形態素・同義語の辞書のメンテナンスをする前に、形態素解析による検索について軽く解説します。 検索対象の文字列 文字列1「私はjavascriptというプログラミング言語が得意です!」 文字列2「私はjavaというプログラミング言語が大嫌いです・・・」 RDBで検索する場合 検索ワード「java」をRDBで検索すると、以下のようになります。 select * from hoge where freeword like '%java%'; 文字列1・・・ヒットする。 文字列2・・・ヒットする。 likeは中間一致検索であるため、文字列1・2共にヒットしてしまいます。 文章に対して完全一致検索をしてもほぼ検索にヒットしないので、通常中間一致検索をします。 しかしこの場合、javaを検索したいのであって、javascriptをヒットさせたくありません。 こういう状態を「
![tree-tips: kuromojiの辞書のメンテナンス | Apache Solr](https://cdn-ak-scissors.b.st-hatena.com/image/square/a69c1ca07e64b3074700d81a1ac2963dcb817aaf/height=288;version=1;width=512/http%3A%2F%2Fwww.tree-tips.com%2Fstatic%2Fimg%2Feyecatch%2Fsolr%2Fmain_eyecatch.png)