Love the Rainforest! My name is David Weiller and I have been photographing and filming the beautiful wildlife of the rainforest since more than 14 years.Now...
本ソフトウェアは、あらかじめ対象となる文書群から検索に必要な情報を格納 するデータベースを作成しておき、それに対して検索を行う全文検索システムです。 検索方式は N-gram 方式や分かち書き方式から選べます。 また、必要に応じて文字列処理モジュールを差し替えることができます。 なお、本ソフトウェアは IPA の平成16年度オープンソースソフトウェア活用基盤整備 事業の委託を受けて開発を行っています。 新着情報 2006-03-08: オープンソースマガジン誌 2006年4月号 「いざ、次世代検索エンジンへ」 にRastの記事が掲載されました。 2006-01-18: Software Design誌 2006年2月号 「今すぐできる最新検索システム」 にRastの記事が掲載されました。 2005-11-02: 関西オープンソース2005での発表資料を公開しました。 2005-09-15:
目次 はじめに チュートリアル クローラコマンド Web検索エンジンの実現 はじめに このガイドでは、Hyper EstraierのWebクローラの詳細な使い方を説明します。ユーザガイドとP2Pガイドをまだお読みでない場合は先にそちらに目を通しておいてください。 estcmdだとローカルのファイルシステム上にある文書(ファイル)を対象としたインデクシングしかできません。NFSやSMB等を用いてファイルシステムをリモートマウントすれば別のマシンにある文書をインデクシングすることもできますが、不特定対数のWebサイトの文書を扱おうとするとそうもいきません。wgetなどのクローラで文書を集めて来てローカルに保存してからインデクシングすることも考えられますが、ディスク容量の問題や更新頻度の問題などがあります。 Web上のリンクを辿って文書を収集することをWebクローリングと言い、そのプログラムをW
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く