タグ

ブックマーク / sousk.hatenadiary.org (1)

  • オープンソースの検索エンジン Sphinx について調べたメモ - 観測所日誌

    "全文検索について簡単に調べたメモ" 続き 注意点としては 日語は UTF-8 一択 検索対象 DBUTF-8 だと楽 Ngram のみ インデックスの部分的な更新に難あり blog, ニュース, フォーラムといった蓄積型のコンテンツには良い 更新柔軟性よりパフォーマンスやスケールを取っている 今後、別方式のインデックスを実装するプランはある ライセンスは GPL v2 or 商用(embeded 用) 概要 ドキュメント を読んだメモ。 検索 document は複数の field を持ち、また検索用メタ情報である attribute を持つ。 field は検索に用いられる index 対象となるフィールドであり、Sphinx はこのフィールドを複数個持てる(デフォで上限32個?) attribute はソートや、グルーピング、検索結果の絞り込みに使われる。詳細は 3.2 At

    オープンソースの検索エンジン Sphinx について調べたメモ - 観測所日誌
  • 1