ElasticsearchでKuromoji Tokenizerを試してみたメモです。 前回、NGram TokenizerでN-Gramを試してみたので、 今回は形態素解析であるKuromoji Tokenizerを試してみました。 Ubuntu上でElasticsearch5.4.0で試してみます。 kuromoji kuromojiは日本語の形態素解析器です。 N-Gramでは単語をN文字ごとに分割するのに対して、 kuromojiでは辞書を利用して文章を単語に分割します。 インストール・起動 kuromoji tokenizerはデフォルトでは入っていないのでインストールする必要があります。 Japanese (kuromoji) Analysis pluginをインストールします。 Japanese (kuromoji) Analysis pluginには下記のトークナイザとフィ