タグ

様々な切り口とindexに関するshirotorabyakkoのブックマーク (1)

  • 第2回 役割は文書の分析・索引・ランキング

    各種サーバーに格納されている情報を整理し,情報を引き出せるようにするエンタープライズ・サーチ製品。文書の量やユーザー数によってシステムの設計方法は変わってくる。ポイントになるのは,サーチ・エンジンを構成する三つの基機能の配置の仕方だ。 エンタープライズ・サーチのシステムは,インターネットで使われている検索エンジンと構造的には同じである。具体的には,(1)ネットワークを介して検索対象のシステムから文書を収集する「クローラ」,(2)収集した文書からテキストを抽出して索引を作成する「インデクサ」,(3)ユーザーからの問い合わせに従って索引を調べ,検索結果を返す「サーチャー」という三つのプログラム・モジュールが連携して動作する(図3)。エンタープライズ・サーチ製品は,これに簡易なポータル・サーバーの機能や,アクセス制御を実現するためのディレクトリ・サービス連携機能を持たせてある。 図3●エンター

    第2回 役割は文書の分析・索引・ランキング
    shirotorabyakko
    shirotorabyakko 2007/05/09
    検索対象のシステムから文書を収集する「クローラ」、収集文書からテキストを抽出し索引を作成する「インデクサ」、問い合わせに索引を調べ,検索結果をランキングして返す「サーチャー」の3つ
  • 1