エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
Elasticsearchのkuromoji tokenizerと同義語辞書の挙動 - Qiita
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
Elasticsearchのkuromoji tokenizerと同義語辞書の挙動 - Qiita
前提 Elasticsearch 7.9.1での検証結果です。 現象 Synonym graph token filterに日本語の複合語とみな... 前提 Elasticsearch 7.9.1での検証結果です。 現象 Synonym graph token filterに日本語の複合語とみなされる文字列(例: 東京大学)を渡すと、以下のようなエラーが出る。 下記のページで説明されている現象と同じ: ElasticsearchのSynonym追加において一部の日本語の文字でillegal_argument_exceptionが出る問題 - Qiita インデックス作成リクエスト PUT test { "settings": { "analysis": { "char_filter": { "normalize": { "type": "icu_normalizer", "name": "nfkc", "mode": "compose" } }, "tokenizer": { "ja_kuromoji_tokenizer": { "mod