[B! hyperestraier] kzfmのブックマーク

kzfm id:kzfm

hyperestraierに関するkzfmのブックマーク (2)

Hyper Estraier インストール（３）　オリジナル検索エンジンの作成 : Enjoy Hyper Estraier
2007年06月15日 22:33 Hyper Estraier インストール（３）　オリジナル検索エンジンの作成前回までで、とりあえずコマンド上でHyper Estraierが使えるようになりました。せっかくここまで来たらオリジナル検索エンジンを公開したくなりませんか？ Hyper Estraierには高性能のクローラーもついていますし、CGIによる検索サンプルプログラムも付属していますので、いくつかのファイルを設定するだけでオリジナル検索エンジンを公開することができます。今回は１台のPCで（一応）P2P機能を使ってクローラーを動かして、検索するところまで解説したいと思います。同じ原理で複数台用意すればあなた専用P2P検索エンジンが手に入るはず。１台だとしてもノードを使ったほうが色々便利みたいです。（RSS配信できたり、複数のインデックスを同時に使えたり）今回は特定サ
kzfm 2008/11/26
hyperestraier
リンク
Crawler Guide of Hyper Estraier Version 1 (Japanese)
目次はじめにチュートリアルクローラコマンド Web検索エンジンの実現はじめにこのガイドでは、Hyper EstraierのWebクローラの詳細な使い方を説明します。ユーザガイドとP2Pガイドをまだお読みでない場合は先にそちらに目を通しておいてください。 estcmdだとローカルのファイルシステム上にある文書（ファイル）を対象としたインデクシングしかできません。NFSやSMB等を用いてファイルシステムをリモートマウントすれば別のマシンにある文書をインデクシングすることもできますが、不特定対数のWebサイトの文書を扱おうとするとそうもいきません。wgetなどのクローラで文書を集めて来てローカルに保存してからインデクシングすることも考えられますが、ディスク容量の問題や更新頻度の問題などがあります。 Web上のリンクを辿って文書を収集することをWebクローリングと言い、そのプログラムをW
kzfm 2008/11/22
hyperestraier
リンク
1

お知らせ

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

はてなブックマーク

タグ

関連タグで絞り込む (0)

hyperestraierに関するkzfmのブックマーク (2)

お知らせ

今週のはてなブックマーク数ランキング（2024年6月第4週）

今週のはてなブックマーク数ランキング（2024年6月第3週）

今週のはてなブックマーク数ランキング（2024年6月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

タグ

関連タグで絞り込む (0)

hyperestraierに関するkzfmのブックマーク (2)

Hyper Estraier インストール（３） オリジナル検索エンジンの作成 : Enjoy Hyper Estraier

Crawler Guide of Hyper Estraier Version 1 (Japanese)

お知らせ

今週のはてなブックマーク数ランキング（2024年6月第4週）

今週のはてなブックマーク数ランキング（2024年6月第3週）

今週のはてなブックマーク数ランキング（2024年6月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

Hyper Estraier インストール（３）　オリジナル検索エンジンの作成 : Enjoy Hyper Estraier