タグ

検索と読み物に関するblueribbonのブックマーク (2)

  • どうなっているの?あのソフトの仕組み - 今からでも遅くない!アルゴリズム入門:selfup

    Webの全体像を効率よく取り込み,分類する 「YSTのシステムは大まかに三つの機能に分かれます(図2)。最初は世界中のWebページをYSTのシステムに取り込む『クローリング(crawling)』という機能です」(Yahoo! JAPAN,リスティング事業部 検索企画室の宮崎光世氏,以下同)。 取り込むと簡単に言っても,Webページの数は膨大なうえ,更新の頻度や情報の質などがまちまちです。すべてのページに同じようにアクセスしていると非効率なことこの上ありません。そこで,限られた時間で質の良い検索ができるようにするための工夫をしています。例えば,クローリングを繰り返すうちに頻繁に更新されることがわかったページは短いサイクルでチェックし,ほとんど更新のないページはチェックの頻度を落とす,といったことをしているそうです。 ただ,更新の頻度が単に高いだけではダメです。重要性が高いと考えられるWebサ

    どうなっているの?あのソフトの仕組み - 今からでも遅くない!アルゴリズム入門:selfup
    blueribbon
    blueribbon 2006/10/26
    「情報量の勝負に見えるWeb検索サービスも,一番重要な部分は人の知識と経験抜きには成り立たないのです。」
  • グーグル検索結果から私を消して!:マリコ駆ける!:オルタナティブ・ブログ

    「私の名前をグーグルで検索しても、何もひっかからないようにしてください」という依頼が来たらどうしますか? クライアントから「なんとか当社のサイトを○○という言葉でグーグルで検索した時に一番上にランクされるように」とSEO対策を依頼されることはよくあること。でも、こんな依頼は初めてだ。 随分昔に、当人が関係した事件が起こり、様々なサイトにそのことが書かれていたのだ。最近インターネットを覚えた当人は、今頃になってその事実に気づいたわけだ。(ちなみに当人への中傷が書かれていたわけではなく、出来事として取り上げられていただけ) 『WEBサイトから関連情報そのものを消すことはできないのですか?そんな昔のことが載ってるなんて嫌ですよ。』 「ひとつひとつサイトを調べて、削除依頼を出すことは出来ますよ。ですが、その希望をサイトのオーナーが受け入れるかは別問題です。ただそんなことしたら、既に鎮火している話題

    グーグル検索結果から私を消して!:マリコ駆ける!:オルタナティブ・ブログ
  • 1