関連タグで絞り込む (14)
クローラ
タグ
ちょっと現実頭皮的に自己満足的プログラムを書きたくなったので Twitter のクローラーを書いてみた。C++ にしては、割とすっきり書けて満足。 使ったライブラリsociデータベースライブラリpicojsonjson パーサーboost.asioネットワークライブラリboost.date_ti... 続きを読む
このブログでは初めましての長野雅広(kazeburo)です。mixi開発部・運用グループでアプリケーションの運用を担当しています。 12月12日よりmixiのRSSのCrawlerが改善され、外部ブログの反映が今までと比べ格段にはやくなっているのに気付かれた方も多いかと思い... 続きを読む
JSpider is: A highly configurable and customizable Web Spider engine. Developed under the LGPL Open Source license In 100% pure Java You can use it to : Check your site for errors (internal server errors, ...) Outgoing and/or internal link ch... 続きを読む
ブログリレー第9記者、開発部のつっつーです。 4月で入社2年目になりました。今はサグールテレビの検索チームでいろいろ面白いことをしてます。 検索エンジンといえば、Google, Yahoo、そしてラボのサグールなど、いろいろありますが、実は自分だけの検索エン... 続きを読む
Nutchは、オープンソース・ウェブ検索エンジンを実装する初めての試みです。 ウェブ検索はインターネット・ナビゲーションのために必用な基本的機能です。ところが現在では、ウェブ検索エンジンの数は減少しています。 今日の寡占状態は、すぐに、ほとんど全て... 続きを読む
Web屋のネタ帳 Webビジネスに必要な「戦略」「システム」「デザイン」の3要素とそれらをまとめる「マネジメント」について現場の実感と独自の観点でお送りするコラム・・・のはずなんですが、要するにWebがらみのシステム&デザイン業界に関する小ネタと... 続きを読む

