サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
猛暑に注意を
hyperestraier.sourceforge.net
目次 はじめに アーキテクチャ チュートリアル ノードマスタ用コマンド プロトコル ノードAPI クライアント用コマンド 疑似ノードマスタ メタ検索ゲートウェイ 助言 はじめに このガイドでは、Hyper EstraierのP2P機構の詳細な使い方を説明します。ユーザガイドをまだお読みでない場合は先にそちらに目を通しておいてください。 estseek.cgiで検索を行う場合、起動する度にデータベースを立ち上げ直すので、処理効率が悪いです。また、estcmdでデータベースの更新作業を行っている間は、データベースがロックされてしまうので検索ができません。これらの問題に対処するために、Hyper EstraierはC/S(クライアント/サーバ)方式のサーバプログラムを提供します。データベースを内包したプロセスをシステムに常駐させておいて、それをネットワーク経由で操作するものです。C/S方式には以
目次 はじめに アーキテクチャ ビルド 文書を扱うAPI 検索条件を扱うAPI データベースを扱うAPI ギャザラのサンプル サーチャのサンプル 並列性 助言 はじめに このガイドでは、Hyper EstraierのAPIの詳細な使い方を説明します。ユーザガイドをまだお読みでない場合は先にそちらに目を通しておいてください。 全文検索システムの機能要件は様々ですが、代表的なものを挙げてみましょう。 リポジトリへの要求 ファイルシステム、メールボックス、Web、Wiki、RDBMS、各社の文書管理システムなどへの対応。 文書形式への要求 プレーンテキスト、HTML、MIME、PDF、RTF、MS-Word、MP3、各種の画像(OCR)などへの対応。 言語や語彙への要求 日本語、英語、中国語などの各種言語対応。類義語の正規化。表記揺れの正規化。 ユーザインターフェイスへの要求 検索条件の指定方法
NAME SYNOPSYS INTRODUCTION Setting DESCRIPTION Class Document Class Condition Class Result Class Database EXAMPLE Gatherer Searcher LICENSE NAME Perl Binding of Hyper Estraier SYNOPSYS use Estraier; INTRODUCTION Hyper Estraier is a full-text search system for communities. This is a package implementing the core API of Hyper Estraier ( http://hyperestraier.sourceforge.net/ ), including native codes
目次 はじめに チュートリアル クローラコマンド Web検索エンジンの実現 はじめに このガイドでは、Hyper EstraierのWebクローラの詳細な使い方を説明します。ユーザガイドとP2Pガイドをまだお読みでない場合は先にそちらに目を通しておいてください。 estcmdだとローカルのファイルシステム上にある文書(ファイル)を対象としたインデクシングしかできません。NFSやSMB等を用いてファイルシステムをリモートマウントすれば別のマシンにある文書をインデクシングすることもできますが、不特定対数のWebサイトの文書を扱おうとするとそうもいきません。wgetなどのクローラで文書を集めて来てローカルに保存してからインデクシングすることも考えられますが、ディスク容量の問題や更新頻度の問題などがあります。 Web上のリンクを辿って文書を収集することをWebクローリングと言い、そのプログラムをW
目次 はじめに 文書の属性 ファイル形式 検索条件式 検索語の抽出 管理用コマンド 検索用CGIスクリプト 表示用CGIスクリプト インデックスの構造 助言 よく聞かれる質問 はじめに このガイドでは、Hyper Estraierのアプリケーションの詳細な使い方を説明します。イントロダクションをまだお読みでない場合は、先にそちらに目を通しておいてください。 Hyper Estraierは、いわゆるインデックス型の検索システムです。検索を行う前に、対象文書の情報を登録したインデックスを準備しておく必要があります。その手間がかかるかわりに、とても高速に検索を行うことができます。Hyper Estraierはインデックスを管理するコマンド「estcmd」とインデックスを使って検索を行うCGIスクリプト「estseek.cgi」からなります。つまり、コマンドラインでインデックスの管理作業を行い、W
目次 はじめに インストール 検索機能の配備 補足 はじめに Hyper Estraierは全文検索システムです。たくさんの文書の中から、特定の語句を含むものを探して、該当するものの一覧を表示することができます。Webサイトを運営している方なら、自分のサイト専用の検索エンジンとして利用することができます。メールボックスやファイルサーバを対象とした検索ツールとして利用することもできます。 Hyper Estraierには、次のような特徴があります。 インデックスを使った高速な検索ができます。 大量の文書のインデックスを短時間で作成できます。 N-gram方式による漏れのない検索ができます。 形態素解析とN-gramのハイブリッド機構で検索精度を向上させます。 フレーズ検索や正規表現検索や属性検索や類似検索をサポートします。 世界各国の言語が扱えます。 対象文書の所在や形式に依存しません。 賢
概要 Hyper Estraierは全文検索システムです。たくさんの文書の中から、特定の語句を含むものを探して、該当するものの一覧を表示することができます。Webサイトを運営している方なら、自分のサイト専用の検索エンジンとして利用することができます。メールボックスやファイルサーバを対象とした検索ツールとして利用することもできます。 Hyper Estraierには、次のような特徴があります。 インデックスを使った高速な検索ができます。 大量の文書のインデックスを短時間で作成できます。 N-gram方式による漏れのない検索ができます。 形態素解析とN-gramのハイブリッド機構で検索精度を向上させます。 フレーズ検索や正規表現検索や属性検索や類似検索をサポートします。 世界各国の言語が扱えます。 対象文書の所在や形式に依存しません。 賢いWebクローラが付属しています。 ライブラリとして各種
Hyper Estraier is a full-text search system. It works as with Google, but based on peer-to-peer architecture. Using Hyper Estraier, we can construct a large-scaled search engine with cheap computers.
このページを最初にブックマークしてみませんか?
『Hyper Estraier: a full-text search system for communities』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く