タグ

solrに関するwillnetのブックマーク (23)

  • Solr でファセット検索 | Lucid Imagination by Basis Technology

    ファセットを使った検索は、 あらゆる種類の検索アプリケーションで見つけやすさとユーザー体験を向上する方法として、 欠かすことのできない機能となりつつある。 稿では、 Solr の生みの親、 Yonik Seeley(ヨニック・シーリー)が、 Solr におけるファセット検索の基を紹介する。 ファセット検索は、 諸項目や検索結果をカテゴリー別に動的なかたまりに分けることにより、 ユーザーが任意のフィールドの任意の値により検索結果を絞り込む(あるいは除外する)ことを可能とします。 画面上のファセットひとつひとつには、検索結果中のそのカテゴリーに一致するヒット数が表示されます。 ユーザーは、検索結果に制約を与えることにより、絞り込んでいくことができます。 ファセット検索は、 ファセット閲覧、 ファセット・ナビゲーション、 ガイド付きナビゲーション、 パラメーター的検索、 などとも呼ばれます。

    willnet
    willnet 2011/06/28
    ファセット検索は、 諸項目や検索結果をカテゴリー別に動的なかたまりに分けることにより、 ユーザーが任意のフィールドの任意の値により検索結果を絞り込む(あるいは除外する)ことを可能とします
  • Ride(らいど)の技術メモ solr schema.xml (1文字の日本語検索が CJKAnalyzer では駄目だった)

    CJKAnalizerでは「花」の1文字の検索を行うと、検索出来ない不具合が見つかった。 その他に検索できない日語が色々出てきたので、CJKAnalizerには身を引いてもらいます。 んで、色々試したのですがどれも一長一短すぎ、使い物にならないので、 N-Gramを使用することにしました。 N-Gram を 1-gram で使用した場合、語句に関係無く文字が一致するとヒットしてしまうので、検索ワードが2文字以上の場合は 2-gram を使用する方針としました。 データ上に検索キーワードが存在するのに CJKAnalizer ではヒットしない場合があるなんて、信じられない!。 solrを使用している事例は日語のページでも見ますが、こういう事が明らかにされていないのは非常に不親切ではないでしょか?? 実際solrの問い合わせパラメータを日語で説明しているサイトも無いし、オープンソースなん

    willnet
    willnet 2011/06/24
    検索文字の長さで1gramと2gramを分ける例
  • BasisCon2010-Japanese-Solr-revised.ppt

    Solr www.rondhuit.com Apache Lucene/Solr • Apache Lucene – Java • Apache Solr – Lucene • • N-gram • • • – • • •  •  • •  • Fuzzy • GoogleGoogle CharFilter – Reader CharStream +correctOffset(int):int CharReader input:Reader CharFilter input:CharStream correct(int):int BaseCharFilter pcmList: List<OffCorrectMap> getLastCumulativeDiff ():int addOffCorrectMap (int,int):void OffCorrectMap off:int

    willnet
    willnet 2011/06/24
    ngramはn以下の文字の検索が出来ない