タグ

textsearchとtsearch2に関するrhosoiのブックマーク (2)

  • textsearch-ja: Project Home Page

    形態素解析を使用した、組み込み型の日語全文検索です。 ダウンロード : ソースコードのほか、Windows 用バイナリもダウンロードできます。 バグレポート メーリングリスト への参加 概要 インストール 依存関係 MeCab テキスト検索機能 インデックス (tsvector, tsquery) 検索結果の強調 (ts_headline) 解析結果の表示 (ts_debug) 類義語 (synonym) ストップワード (stop word) その他の検索用関数 Web検索互換クエリ (web_query) 日語解析機能 テキストの正規化 (ja_normalize) 分かち書き (ja_wakachi) mecab による解析 (ja_analyze) ふりがな (furigana) ひらがな変換 (hiragana) カタカナ変換 (katakana) TODO 概要 日語テキ

  • textsearch_senna

    N-gram を使用した、組み込み型の日語全文検索です。 ダウンロード : ソースコードのほか、Windows 用バイナリもダウンロードできます。 バグレポート メーリングリスト への参加 概要 インストール テキスト検索機能 %% 演算子 @@ 演算子 インデックス (senna) インデックス・オプション (WITH) インデックスのメンテナンス senna.drop_index() senna.reindex_index() 不要ファイルの調査 TODO 概要 日語テキストの全文検索を行います。 形態素解析ベースである textsearch-ja とは異なり、textsearch_senna では N-gram ベースの全文検索を行います。 検索には、全文検索エンジン Senna を使用しています。 利点として、文字すべてをインデックス化するため LIKE 中間一致検索に近い結果

  • 1