teematsuのブックマーク / 2017年6月22日

Ride（らいど)の技術メモ　solr schema.xml (１文字の日本語検索が CJKAnalyzer では駄目だった）

CJKAnalizerでは「花」の１文字の検索を行うと、検索出来ない不具合が見つかった。その他に検索できない日本語が色々出てきたので、CJKAnalizerには身を引いてもらいます。んで、色々試したのですがどれも一長一短すぎ、使い物にならないので、 N-Gramを使用することにしました。 N-Gram を 1-gram で使用した場合、語句に関係無く文字が一致するとヒットしてしまうので、検索ワードが２文字以上の場合は 2-gram を使用する方針としました。データ上に検索キーワードが存在するのに CJKAnalizer ではヒットしない場合があるなんて、信じられない！。 solrを使用している事例は日本語のページでも見ますが、こういう事が明らかにされていないのは非常に不親切ではないでしょか？？実際solrの問い合わせパラメータを日本語で説明しているサイトも無いし、オープンソースなん

はてなブックマーク

タグ

2017年6月22日のブックマーク (2件)

【N-gram】全文検索エンジン Apache Solrを使ってみた – FiS Project

Ride（らいど)の技術メモ　solr schema.xml (１文字の日本語検索が CJKAnalyzer では駄目だった）

お知らせ

今週のはてなブックマーク数ランキング（2024年10月第2週）

今週のはてなブックマーク数ランキング（2024年10月第1週）

月間はてなブックマーク数ランキング（2024年9月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

タグ

2017年6月22日のブックマーク (2件)

【N-gram】全文検索エンジン Apache Solrを使ってみた – FiS Project

Ride（らいど)の技術メモ solr schema.xml (１文字の日本語検索が CJKAnalyzer では駄目だった）

お知らせ

今週のはてなブックマーク数ランキング（2024年10月第2週）

今週のはてなブックマーク数ランキング（2024年10月第1週）

月間はてなブックマーク数ランキング（2024年9月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

Ride（らいど)の技術メモ　solr schema.xml (１文字の日本語検索が CJKAnalyzer では駄目だった）