タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

検索に関するunmo0217のブックマーク (2)

  • どうなっているの?あのソフトの仕組み - 今からでも遅くない!アルゴリズム入門:selfup

    Webの全体像を効率よく取り込み,分類する 「YSTのシステムは大まかに三つの機能に分かれます(図2)。最初は世界中のWebページをYSTのシステムに取り込む『クローリング(crawling)』という機能です」(Yahoo! JAPAN,リスティング事業部 検索企画室の宮崎光世氏,以下同)。 取り込むと簡単に言っても,Webページの数は膨大なうえ,更新の頻度や情報の質などがまちまちです。すべてのページに同じようにアクセスしていると非効率なことこの上ありません。そこで,限られた時間で質の良い検索ができるようにするための工夫をしています。例えば,クローリングを繰り返すうちに頻繁に更新されることがわかったページは短いサイクルでチェックし,ほとんど更新のないページはチェックの頻度を落とす,といったことをしているそうです。 ただ,更新の頻度が単に高いだけではダメです。重要性が高いと考えられるWebサ

    どうなっているの?あのソフトの仕組み - 今からでも遅くない!アルゴリズム入門:selfup
  • 「とりあえずググる」を卒業!TOPエンジニアの検索術/Tech総研

    「あの情報、絶対にあったはず!」とわかっていても、ネット上にもPC内にも見つからないという経験は誰にでもあるだろう。そんなヤキモキ解消テクニックを、検索ツール活用の達人に聞く。 さまざまな情報がネットにあふれるこの時代。ちょっとした調べ物で、検索エンジンにキーワードを入れてみたら、何千件もヒットしてしまい、手に負えなかったりする。逆に、どこかに必ずあるはずの情報にたどり着けなくてもどかしい思いをすることもある。 また、自分のPCの中に蓄積される情報も、増える一方。ストレージの容量は幾何級数的に伸びていき、その管理もますますややこしくなっていく。 データが少なかった昔なら、用途別にきちんとフォルダを区切り、さらにそれを階層分けして、整然としたツリー構造に……などということも可能だったかもしれない。しかし今や、そんな手法が通用しない情報の氾濫にさらされているのである。 情報管理は「分類・階層化

  • 1