Elasticsearchで日本語全文検索をするときの最低限の設定(形態素解析のみ) - Qiita

テクノロジーカテゴリーの変更を依頼記事元:

qiita.com/kouyaf77@github

5users がブックマークコメント

コメント

0

記事へのコメント0件

注目コメント
新着コメント

新着コメントはまだありません。
このエントリーにコメントしてみましょう。

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

Elasticsearchで日本語全文検索をするときの最低限の設定(形態素解析のみ) - Qiita

前提知識 Analyzer(分析の流れ) テキスト -> char filter -> tokenizer -> token filter -> トークン化... 前提知識 Analyzer(分析の流れ) テキスト -> char filter -> tokenizer -> token filter -> トークン化されたテキスト char filter テキストになにかしらの処理をする。例、HTMLタグを削除する。 tokenizer char filterで処理されたテキストをトークン化する。例、形態素解析、N-gram token filter tokenizerでトークン化された単語(トークン)になにかしらの処理をする。例、「飲み」を「飲む」に変換する。設定するモジュール Char filter icu_normalizer 文字の正規化、大文字を小文字に統一したり、①を1にしたりする。設定はデフォルのまま。 ICU Analysis Pluginを入れる必要があります。また、char filterで正規化をするため、filterでcj

Elasticsearch

ブックマークしたユーザー

odan32402019/01/23
hohoho_ho20052017/03/11
f-suger2017/03/11

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

いま人気の記事 - 企業メディア

企業メディアをもっと読む

設定を変更しましたx