タグ

検索エンジンに関するelasticorabonaのブックマーク (2)

  • Topsy

    A search engine powered by tweets New here? Search for TED, Kindle, Prop 8 Look up your Twitter username

    elasticorabona
    elasticorabona 2010/07/05
    Twitterでの被リンクを検索上位に。
  • 第12回 索引の分散 | gihyo.jp

    はじめに GoogleなどのWeb検索エンジンでは、2004年ごろには数10Tバイトの索引を数万台のサーバに分散させていたと言われています。これは、大量のデータを索引化したり大量のクエリを捌く必要がある際に、1台のマシンでは十分な速度が出ないことがあるためです。近年のハードウェアの進化はめまぐるしいですが、それでもハードウェアによるスケールアップには限界があるため、大規模な検索エンジンにおいて検索処理をスケールさせるには複数台のマシンの利用が不可欠となります。今回は、転置索引の複数のサーバへの分散方法について見ていきます。 複数台サーバにおける転置索引 複数のサーバを利用して検索処理を高速化させる方法には、索引のレプリケーション(replication)と索引の分散(distribution)の2つがあります。索引のレプリケーションとは、複数台のマシンに同じ転置索引(のコピー)を配置する方

    第12回 索引の分散 | gihyo.jp
  • 1