Blugeは Go で書かれた全文検索エンジンです。Go 製の全文検索エンジンといえば Bleve が有名ですが、bluge はその後継となります。 Bleve には日本語用の形態素解析が blevesearch/blevex に用意されていたのですが、Bluge の方にはなかったので、kagome を利用して日本語形態素解析のアナライザーを用意しました。 検索で必要な形態素解析を用意する Analyzer を用意していきます。Analyzer は Char filters Tokenizer Token filters の3つの層からなります。Solr とか Elasticsearch とかと同じような構成です。Char filters -> Tokenizer -> Token filters の順に適用されます。 Char filters 入力を NFKC で正規化します。たとえば、