タグ

2006年12月3日のブックマーク (4件)

  • David Weiller

    Love the Rainforest! My name is David Weiller and I have been photographing and filming the beautiful wildlife of the rainforest since more than 14 years.Now...

    David Weiller
    HeRo
    HeRo 2006/12/03
  • Rast: a full-text search system - FrontPage.ja

    ソフトウェアは、あらかじめ対象となる文書群から検索に必要な情報を格納 するデータベースを作成しておき、それに対して検索を行う全文検索システムです。 検索方式は N-gram 方式や分かち書き方式から選べます。 また、必要に応じて文字列処理モジュールを差し替えることができます。 なお、ソフトウェアは IPA の平成16年度オープンソースソフトウェア活用基盤整備 事業の委託を受けて開発を行っています。 新着情報 2006-03-08: オープンソースマガジン誌 2006年4月号 「いざ、次世代検索エンジンへ」 にRastの記事が掲載されました。 2006-01-18: Software Design誌 2006年2月号 「今すぐできる最新検索システム」 にRastの記事が掲載されました。 2005-11-02: 関西オープンソース2005での発表資料を公開しました。 2005-09-15:

  • Hyper Estraier: a full-text search system for communities

    Hyper Estraier is a full-text search system. It works as with Google, but based on peer-to-peer architecture. Using Hyper Estraier, we can construct a large-scaled search engine with cheap computers.

  • Crawler Guide of Hyper Estraier Version 1 (Japanese)

    目次 はじめに チュートリアル クローラコマンド Web検索エンジンの実現 はじめに このガイドでは、Hyper EstraierのWebクローラの詳細な使い方を説明します。ユーザガイドとP2Pガイドをまだお読みでない場合は先にそちらに目を通しておいてください。 estcmdだとローカルのファイルシステム上にある文書(ファイル)を対象としたインデクシングしかできません。NFSやSMB等を用いてファイルシステムをリモートマウントすれば別のマシンにある文書をインデクシングすることもできますが、不特定対数のWebサイトの文書を扱おうとするとそうもいきません。wgetなどのクローラで文書を集めて来てローカルに保存してからインデクシングすることも考えられますが、ディスク容量の問題や更新頻度の問題などがあります。 Web上のリンクを辿って文書を収集することをWebクローリングと言い、そのプログラムをW