タグ

2008年7月29日のブックマーク (3件)

  • Google、把握するURLが1兆ページ突破と報告

    Googleは7月25日、同社が把握するWeb上のURL数が1兆ページを超えたことを、公式ブログで明らかにした。 同社によると、1998年に初めてインデックスを作成した時点で既に2600万ページを数えたが、2000年にはインデックスページが10億を突破。その後もURLは爆発的に増え続け、Googleが把握している独立したURLの数は、このほどついに1兆ページを突破したという。 Googleはページを数える方法として、まず頻繁に利用されるページを起点として定め、そこから新たなページへのリンクをたどっていくとしている。そのリンク先からまったく同じコンテンツを含むURLや、自動生成されたコピーを省いた残りが今回発表した1兆ページであり、現在1日に数十億ページが新たに生成されているという。 1兆ページの多くは内容が似通っているかWebカレンダーの自動生成コンテンツなどあまり検索の役に立たないもの

    Google、把握するURLが1兆ページ突破と報告
    Andrey_2Ko
    Andrey_2Ko 2008/07/29
    リンク先からまったく同じコンテンツを含むURLや、自動生成されたコピーを省いた残りが今回発表した1兆ページであり、現在1日に数十億ページが新たに生成されている
  • Expired

    Expired:掲載期限切れです この記事は,産経デジタルとの契約の掲載期限(6ヶ月間)を過ぎましたのでサーバから削除しました。 このページは20秒後にNews トップページに自動的に切り替わります。

    Andrey_2Ko
    Andrey_2Ko 2008/07/29
    厚労省の昨年の推計で東京23区に約2000人いるとされるネットカフェ難民
  • 元Google技術者、新たな検索エンジンを立ち上げ

    Googleエンジニアが立ち上げた企業Cuilが7月28日、従来とは異なる手法を使った新しい検索エンジンを発表した。 Cuil(「クール」と発音する)の検索エンジンは、従来のリンク分析やトラフィックランキングといった手法ではなく、Webページの内容を分析し、それに基づいて検索結果のランキングを決める。また類似の検索結果をグループ化し、検索結果を「雑誌スタイル」でテーマごとに表示したり、さらにカテゴリーごとに検索することもできる。 例えば「Harry Potter」を検索すると、検索結果ページは「すべての検索結果」「Harry Potter Books」「Harry Potter Games」などのテーマごとにタブで区切られ、右側には「Actors」「Movie Stars」「Directors」などのカテゴリーが表示される。 Cuilは「ほかの検索エンジンの3倍に上る1200億のWebペ

    元Google技術者、新たな検索エンジンを立ち上げ
    Andrey_2Ko
    Andrey_2Ko 2008/07/29
    Webページの内容を分析し、それに基づいて検索結果のランキングを決める。また類似の検索結果をグループ化し、検索結果を「雑誌スタイル」でテーマごとに表示