タグ

2008年7月30日のブックマーク (2件)

  • グーグル、ウェブクローリング作業の範囲を公表

    米国家安全保障局がGoogleに多くの誇れる権利を委ね、自身のコンピュータの問題について話すことができないのは残念なことだ。 米国時間7月25日に投稿されたブログの中で、Googleは、検索結果をユーザーに提供する前に行う必要があるウェブのインデックス作成と処理という検索業務の課題について詳しく説明した。内容を短くまとめると、Googleには大きなことを考える以外に選択肢はないということだ。 最初に行われるのはネットサーフィンだ。ソフトウェアエンジニアであるJesse Alpert氏とNissan Hajaj氏は、「まず、巧妙なリンク構成の初期ページから各リンクをたどって新しいページに移動する。次に、それらの新しいページのリンクからさらに別のページに移動していき、最終的には膨大なリンクのリストが作られる。重複するリンクを削除した後でも、一意のURLが1兆もあり、ウェブページの数は1日数十億

    グーグル、ウェブクローリング作業の範囲を公表
  • 新検索エンジン「Cuil」が始動--グーグルの対抗馬となるか?

    大規模な新しい検索エンジン「Cuil」が米国時間7月28日に始動した。スタンフォード大学のTom Costello教授とGoogleの元検索アーキテクトであるAnna Patterson氏の夫がチームを組んでCuilを開発し、運営も行う。Googleの主力商品である検索エンジンよりも、あらゆる点で規模が大きく高速で精度が高いというのがうたい文句だ。 CuilとGoogleのもっとも大きな違いは、ランキングシステムだ。Googleのように外部リンクに基づいてページに優先順位を付ける(「Pagerank」)のではなく、Cuilはウェブページのコンテンツを分析して、検索クエリとの関連性を推測する。最近Microsoftに買収されたPowerSetのようなセマンティック(自然言語)検索エンジンなのか尋ねたところ、Costello教授は気色ばんだ。Costello教授は、Cuilの検索は「コンテキ

    新検索エンジン「Cuil」が始動--グーグルの対抗馬となるか?