タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

gunghoに関するMOZZのブックマーク (4)

  • Kazuho@Cybozu Labs: Gungho をインライン化してみた

    « Mylingual Slides @ YAPC::Asia 2007 | メイン | Re: PoCo::Client::HTTP が勝手に文字コードを変えてしまう件 » 2007年04月16日 Gungho をインライン化してみた ちょっとクローラーが必要になったのですが、POE の勉強は面倒なので Gungho を使って作ることにしました。開発が始まったばかりっぽいけど、使いやすそうだし期待大ということで。で、コードを読んでいて思ったのは、provider (URL をフィードするモジュール) と handler (ダウンロードしたコンテンツを処理するモジュール) は再利用されない (=各アプリケーション専用の処理になる) 場合も多いんじゃないかということ。だったらいちいちパッケージ定義して設定値渡しとか面倒だよねというか、ぶっちゃけ自分がクロージャで書きたいと思ったので、ラッパー

  • Gungho::Inlineを使ってみる - file-glob こと k.daibaの日記

    Gungho::Inlineを使ってみる Gungho,悪戦苦闘しています.ちょっと試してみるにはGungho::Inlineを使えばいいんですが,Componentをどうやって組み込めばいいのかがわからなくて試行錯誤の繰り返しです.まだThrottling機能は使えないんですが,簡単なサンプルができたので皆さんの添削を期待してアップします. サンプルの挙動 防災科学研究所に定期的にアクセスして HTML::Selector::XPathHTML::TreeBuilder::XPathを使って最新震源情報を抽出 前回アクセスした時と内容が違っていたら出力 という簡単なものです. サンプルスクリプト いつもはこの節でスクリプト全文を載せているのですが,今回は先にトピックスの説明をしてみます. use warnings; no warnings qw(redefine); use FileH

    Gungho::Inlineを使ってみる - file-glob こと k.daibaの日記
  • YappoLogs: GunghoっていうWebクロウラーたんの件

    GunghoっていうWebクロウラーたんの件 なんか男前そうなクロウラーたんを発見したお 資料はhttp://www.slideshare.net/lestrrat/gungho-swarmage-pocomdba/を見るべし。 ちなみに、これ書くのに使ったGunghoはVersion 0.09001 のCPANの。 概要 GunghoはPlaggerっぽいwebクロウラーたんです。なのでGunghoの名前空間以下にあるモジュールとかを個別に使おうとしたら大変です。 Gunghoのアーキテクチャにそった一道な動作をさせるのがいいはず。 設定はConfig::Any使ってるので、色んな形式のを使えます。 Providerにより収集URLを取得し、EngineがHTTPでコンテンツを取得し、Handlerで取得したコンテンツを処理します。 Provider,Engine,Handlerは、そ

  • Perlメモ/Gungho/簡単なRSSクローラ - Walrus, Digit.

    Gunghoでもっともカスタムメイドの機会が多い部品は、プロバイダとハンドラです。「何を取得したいか」「取得してどうするのか」という用途に密接にかかわる部品だからです。ここではサンプルとして、データベースをストレージとした、RSS(フィード)クローラを作ってみることにします。 Gunghoの概要や情報源についてはPerlメモ/Gunghoを参照してください。 このフィードクローラは、次のような動作をします。 データベースに、フィード情報を保持するfeedテーブルとエントリ情報、コンテンツを保持するentryテーブルがあります。 フィードの取得 フィードテーブルから、未取得、または最終取得から1時間経過したフィードのURLを読み出します。 読み出したフィードを取得します。 取得したフィードから、エントリ情報を抽出します。新しいエントリURLがあれば、entryテーブルに追加します。 エントリ

  • 1