エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
Elasticsearch で 文字の正規化を icu_normalizer でおこなう - Qiita
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
Elasticsearch で 文字の正規化を icu_normalizer でおこなう - Qiita
概要 Elasticsearch の char_filter のひとつ,icu_normalizer の使い方メモです. オプションの設定方... 概要 Elasticsearch の char_filter のひとつ,icu_normalizer の使い方メモです. オプションの設定方法がよく分からなかったので調べてみました. icu plugin は char_filter 以外にもいろいろ利用可能ですが,ここで扱うのは char_filter だけです. こんなかんじ icu_normalizer を使うと,「㌶」→「ヘクタール」など,いい感じに変換してくれます. ※ 下の画面は,「Å」→「å 」「㌢」→「セ」「ン」「チ」,「①」→「1」,「⑵」→「(」「2」「)」,「Ⅲ」→「i」「i」「i」となっている例です. インストール github: https://github.com/elasticsearch/elasticsearch-analysis-icu バージョンごとにブランチが切られているので,それぞれのブランチの R