タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

hyperestraierに関するkzfmのブックマーク (2)

  • Hyper Estraier インストール(3) オリジナル検索エンジンの作成 : Enjoy Hyper Estraier

    2007年06月15日 22:33 Hyper Estraier インストール(3) オリジナル検索エンジンの作成 前回までで、とりあえずコマンド上でHyper Estraierが使えるようになりました。 せっかくここまで来たらオリジナル検索エンジンを公開したくなりませんか? Hyper Estraierには高性能のクローラーもついていますし、CGIによる検索 サンプルプログラムも付属していますので、いくつかのファイルを設定するだけで オリジナル検索エンジンを公開することができます。 今回は1台のPCで(一応)P2P機能を使ってクローラーを動かして、検索する ところまで解説したいと思います。 同じ原理で複数台用意すればあなた専用P2P検索エンジンが手に入るはず。 1台だとしてもノードを使ったほうが色々便利みたいです。 (RSS配信できたり、複数のインデックスを同時に使えたり) 今回は特定サ

    Hyper Estraier インストール(3) オリジナル検索エンジンの作成 : Enjoy Hyper Estraier
  • Crawler Guide of Hyper Estraier Version 1 (Japanese)

    目次 はじめに チュートリアル クローラコマンド Web検索エンジンの実現 はじめに このガイドでは、Hyper EstraierのWebクローラの詳細な使い方を説明します。ユーザガイドとP2Pガイドをまだお読みでない場合は先にそちらに目を通しておいてください。 estcmdだとローカルのファイルシステム上にある文書(ファイル)を対象としたインデクシングしかできません。NFSやSMB等を用いてファイルシステムをリモートマウントすれば別のマシンにある文書をインデクシングすることもできますが、不特定対数のWebサイトの文書を扱おうとするとそうもいきません。wgetなどのクローラで文書を集めて来てローカルに保存してからインデクシングすることも考えられますが、ディスク容量の問題や更新頻度の問題などがあります。 Web上のリンクを辿って文書を収集することをWebクローリングと言い、そのプログラムをW

  • 1