タグ

2009年7月27日のブックマーク (3件)

  • ユーザの利用にあわせて成長するサーチエンジンの構築

    林 賢紀 農林水産省農林水産技術会議事務局筑波事務所研究情報課 (農林水産研究情報センター) 〒305-8601 茨城県つくば市観音台2-1-2 Tel: 0298-38-7285 FAX: 0298-38-7364 E-Mail: tzhaya@affrc.go.jp 概要 既存の検索エンジンでもつ検索機能に加え「ユーザの利用にあわせて収録データを拡大し自分のデータベースを成長」する機能を実装したサーチエンジンを開発した。このシステムでは、検索結果となったページにアクセスした際にそのページのURLを保存し、このURLとそのページから一階層のリンクをたどりページを取得し、データベースを再構築している。これにより、検索エンジン上のデータをよりノイズの少ないものに保ち、WWW上の情報検索をより効率的に行うことを目的としている。 1998年9月から10月までの間、国内の図書館のWebページをデー

    haneimo
    haneimo 2009/07/27
  • 第7回 検索速度の向上:DWHと端末間に中間サーバー

    「データ検索に1分もかかるのは許せない」--。セブン-イレブンの情報系システム構築を担当しているセブン&アイ・ホールディングスの佐藤政行氏も,検索速度にこだわる一人である。 レスポンスは数秒が当たり前 第2回で紹介したように同社は2006年に情報系システムを刷新したが,その際,データ量は刷新前の5.1Tバイトから15Tバイトに増えた。増えたデータは,立地データや施設データ,さらに過去9年分における各店舗の財務状況や商品の売れ行き動向といったデータである。 データ量は3倍に増えても,佐藤氏は検索に時間がかかるのは絶対に許されないと考えていた。店舗を指導するセブン-イレブンの社員は,1人で複数の店舗を担当しているので,移動や店舗指導などで時間がない。データの検索に時間がかかっていては仕事にならないからである。 佐藤氏が検索速度を向上させるために採った工夫は,情報系システムの利用者端末とDWHの

    第7回 検索速度の向上:DWHと端末間に中間サーバー
  • オープンソースソフトウェアの育て方

    製作著作 © 2005-2013 Karl Fogel, 高木正弘, Yoshinari Takaoka(a.k.a mumumu), under a CreativeCommons Attribution-ShareAlike (表示・継承) license (3.0, 2.1-jp)