タグ

crawlerに関するkokogikoのブックマーク (2)

  • YappoLogs: Xangoというクロウラーフレームワークを使ってみる

    Xangoというクロウラーフレームワークを使ってみる Xango XangoPerlで書かれた汎用クローラーフレームワークです。 イベント型フレームワークPOEを使用することにより高速なクローリングが可能です。 実装にもよりますが、単一プロセス内でインデックシングや文字コードの変換等の処理を 同時に行うアプリケーションでも1秒に5~8 URL、1時間で 18000 ~ 22000 URLの処理が行えます。 ドキュメントはperldocのみっぽいので、日語の情報を残す意味で使い方のメモをば。 相当端折って書いてます。 Xangoを使ったクロウラーを書くには、制御用のにPOEセッションを作る必要があります。 Xangoを制御するためのモジュールを適当な名前で作っておくのがスマートかと思います。 とりあえずセッション作成を行う処理を書きます sub spawn { my $class = s

  • Gungho, Swarmage, PoCo::MDBA

    Post to Twitter Post:  Gungho, Swarmage, PoCo::MDBA From: lestrrat, 12 months ago Gungho, Swarmage, PoCo::MDBAView SlideShare presentation or Upload your own. (tags: shibuya.pm) SlideShare Link close Gungho, Swarmage, PoCo::MDBA 3353 views  |  0 comments  |  0 favorites |  2 embeds (Stats) Share Favorite + Group / Event Download not available ? Categories Add Category cancel T

  • 1