前提 Elasticsearch 7.9.1での検証結果です。 現象 Synonym graph token filterに日本語の複合語とみなされる文字列(例: 東京大学)を渡すと、以下のようなエラーが出る。 下記のページで説明されている現象と同じ: ElasticsearchのSynonym追加において一部の日本語の文字でillegal_argument_exceptionが出る問題 - Qiita インデックス作成リクエスト PUT test { "settings": { "analysis": { "char_filter": { "normalize": { "type": "icu_normalizer", "name": "nfkc", "mode": "compose" } }, "tokenizer": { "ja_kuromoji_tokenizer": { "mod