タグ

sennaに関するf-sugerのブックマーク (6)

  • Senna のインストール

    Senna は DBMS やスクリプト言語処理系等に組み込んで日語全文検索機能を強化するための組み込み型の全文検索エンジンです。 n-gram インデックスと単語インデックスの特徴を兼ね備えた、高速かつ高精度な転置インデックスタイプのエンジンです。 コンパクトな実装ですが、大規模な文書量と検索要求を処理できるように設計されており、純粋な n-gram インデックスを作成することも可能です。 Senna のダウンロードとインストール Senna のソースファイルを Senna 公式サイト からダウンロードしてコンパイル、インストールを行います。 # wget -P /usr/local/src http://jaist.dl.sourceforge.jp/senna/29067/senna-1.1.0.tar.gz # mkdir /usr/local/senna-1.1.0 # cd /

    Senna のインストール
  • Ludia(PostgreSQL+Senna)のインストール備忘録

    PostgreSQLを使っていて、N-gramでサクっと全文検索したいなんて時。 ・Ubuntuに入れたPostgreSQL8.3 ・Fedoraに入れたPostgreSQL8.2 に、インストールしたので、その時の備忘録。 【PostgreSQL】 UbuntuはPostgreSQLをパッケージで入れてたのですが、 開発用のモジュール(なんちゃらdevel)とかがないよーって怒られるので、 ソースからインストールしておきます。 【使ったtarball】 senna-1.1.4.tar.gz ludia-1.5.2.tar.gz 【Sennaインストール】 Ubuntuに入れたときは、configureした後に、makeとmake installをそのままやりましたが、 とにかくアホみたいに時間がかかって、CPUリソースをいました。 調べてみたら↓らしいので # なんかRubyが悪いみた

    Ludia(PostgreSQL+Senna)のインストール備忘録
  • PostgreSQL 8.3.6 に ludia を入れた - the true power

    the true power さすらいのプログラマ堀井俊和の個人的なブログです(元「表参道ではたらくCTOのブログ」)。 海外IT技術系ニュースのキュレーションを実践中。 PostgreSQL 8.3 系の最新バージョンである 8.3.6 に、全文検索システム Ludia 1.5.1 をインストールしてみたところ、 pgsenna2.c:571: error: too few arguments to function ‘IndexBuildHeapScan’ というエラーが発生してコンパイルできない。 ちなみに、OS は CentOS 5.2。 CentOS 5.2 + PostgreSQL 8.3 + Ludia 1.5.1 の組み合わせでのセットアップは何度となくやっている。 ということで、基的には失敗しないはず。 で、真面目にエラーを見てみると、IndexBuildHeapS

    PostgreSQL 8.3.6 に ludia を入れた - the true power
  • Linuxに全文検索エンジンLudiaをインストール - yummy-yummy

    LudiaはSennaを使ったPostgresSQL用の組み込み型全文検索インデックスエンジンです。 ダウンロード 下記サイトからダウンロード。 http://sourceforge.jp/projects/ludia/ Mecab、MeCab辞書、Sennaが含まれているludia-withdepsのパッケージをDLします。 インストール 解凍 $tar -zxvf ludia-withdeps-1.5.0.tar.gz $cd ludia-1.5.0/deps MeCabのインストール 分かち書き方式に形態素解析を利用しない場合は、 MeCab(と辞書)をインストールする必要はありません。その場合はSennaのインストールに進んでください。 (MeCabをインストールしない場合はSennaのインストールの際に、 --without-mecabオプションを指定する必要あり) MeCabを

    Linuxに全文検索エンジンLudiaをインストール - yummy-yummy
  • textsearch_senna

    N-gram を使用した、組み込み型の日語全文検索です。 ダウンロード : ソースコードのほか、Windows 用バイナリもダウンロードできます。 バグレポート メーリングリスト への参加 概要 インストール テキスト検索機能 %% 演算子 @@ 演算子 インデックス (senna) インデックス・オプション (WITH) インデックスのメンテナンス senna.drop_index() senna.reindex_index() 不要ファイルの調査 TODO 概要 日語テキストの全文検索を行います。 形態素解析ベースである textsearch-ja とは異なり、textsearch_senna では N-gram ベースの全文検索を行います。 検索には、全文検索エンジン Senna を使用しています。 利点として、文字すべてをインデックス化するため LIKE 中間一致検索に近い結果

  • http://yaplog.jp/coconai/archive/51

    http://yaplog.jp/coconai/archive/51
  • 1