Perl::Hyper Estraierのつかいかた Posted by speed on Wednesday March 18 2009,@ 17:57 Modify Remove つかいかた インデックスの作成 あなたがWebサイトを運営していて、そのコンテンツが 「/var/www/username/public_html」 以下に置いてあるとしましょう。その下にある全てのHTMLファイルを登録したインデックスを 「/var/www/username/casket」 として作成することにします。それには、以下のコマンドを実行します。 cd /var/www/username estcmd gather -il ja -sd casket /var/www/username/public_html 「/var/www/username/public_html」 以下の文書を収
1. 2006年11月6日 「オープンソースの全文検索、DBMSシステム」 講演資料 Hyper Estraierの 設計と実装 株式会社ミクシィ 平林 幹雄 mikio@users.sourceforge.net 4. Hyper Estraierとは • 読み方 – ハイパーエストレイ(ア|ヤ)(ー)? – estraier: [古仏] 迷う、はぐれる = stray • 全文検索システム – 大量の文書を対象に「フリーワード検索」ができる – 予め転置インデックスを用意することで高速に処理 • 文書規模Nに対する時間計算量 – 全体のインデクシング = O(N) = データ量に比例 – 毎回の検索 = O(log N) = データ量の対数に比例 – N-gram法による漏れのない検索 • 形態素解析の併用による精度向上 5. 用途 • Web検索システム – 特定のサイトの検索機能
Movabletypeにはデフォルトで検索機能がついている。 イマイチ動作が遅いような気がしていた。 そこで、以前にAjaxを使用したエントリタイトルのインクリメントサーチを導入した。 (旧検索ページ) で、今回は(笑) 全テキストの検索エンジンであるHyper Estraier(ハイパーエストレイア)を導入してみた。 (新検索ページ) 検索対象のデータに対してインデックスを事前に作成しているので、すこぶる検索時間が速い。 以下に導入手順を示す。 [導入条件] ・さくらのレンタルサーバ、プレミアムプラン →よってユーザ権限下におけるインストールとなる。 [導入手順] ・公式サイトから、HyperEstraierおよび必要なモジュールのソースをダウンロード(zlib、livconv、qdbm)。※tar.gz形式 ・ソースを、/home/(ユーザ名)/srcにアップロード ・.cshrcを編
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く