タグ

searchengineとserviceに関するnakackのブックマーク (2)

  • 1日最大20億ページのクローリングを安価に実現!『80legs』 | 100SHIKI

    1日最大20億ページのクローリングを安価に実現!『80legs』 September 28th, 2009 Posted in 便利ツール(ウェブ) Write comment サービスの開発上、大量のウェブページのクローリングが必要な場合もある(お行儀良くやりましょうね)。 通常、そうしたクローリングには別途マシンを割り当ててがしがし処理をまわすのだが、あまりに膨大な量のクローリングをする必要がある場合、いろいろとコストがかかってしまう。 そこで「クローリングならうちに任せて!」と声を上げたのが80legsだ。 なんと5万台のマシンを使い、最大20億ページ/日のクローリングが可能だという。しかもデータセンターやクラウドを使うよりぐっと安価ときている。なおかつ、使い方も簡単で、どんなクローリングをしたいかをフォームで申し込むだけらしい。 クローリングという実にニッチなサービスではあるが、必

    1日最大20億ページのクローリングを安価に実現!『80legs』 | 100SHIKI
  • blogWatcher 3.0b :

    8月末より9月18日までサーバー電源系統のトラブルにより、サービスにアクセス出来ない状態が続いておりました。現在はなんでもRSSについては復旧しております。 バーサスサーチについては現在も引き続き復旧に向けて作業をすすめております。 サービス停止に関してご迷惑おかけして申し訳ありません。 復旧まで今しばらくお待ちください。 blogWatcherは2008年2月29日を持ちまして基機能の公開を終了致しました 「なんでもRSS」「バーサス検索」については引き続きご利用出来ます 終了に関する経緯などの詳細は開発日誌をご覧ください blogWatcher開発日誌:お詫び サービス停止のお知らせ

  • 1