f-sugerのブックマーク - はてなブックマーク

f-suger id:f-suger

ブックマーク / qiita.com/kouyaf77@github (1)

Elasticsearchで日本語全文検索をするときの最低限の設定(形態素解析のみ) - Qiita
前提知識 Analyzer(分析の流れ) テキスト -> char filter -> tokenizer -> token filter -> トークン化されたテキスト char filter テキストになにかしらの処理をする。例、HTMLタグを削除する。 tokenizer char filterで処理されたテキストをトークン化する。例、形態素解析、N-gram token filter tokenizerでトークン化された単語(トークン)になにかしらの処理をする。例、「飲み」を「飲む」に変換する。設定するモジュール Char filter icu_normalizer 文字の正規化、大文字を小文字に統一したり、①を1にしたりする。設定はデフォルのまま。 ICU Analysis Pluginを入れる必要があります。また、char filterで正規化をするため、filterでcj
f-suger 2017/03/11
Elasticsearch

形態素解析

全文検索
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx