タグ

2008年5月21日のブックマーク (5件)

  • https://labs.cybozu.co.jp/blog/kazuho/archives/2007/04/gungho.php

  • Gungho::Inlineを使ってみる - file-glob こと k.daibaの日記

    Gungho::Inlineを使ってみる Gungho,悪戦苦闘しています.ちょっと試してみるにはGungho::Inlineを使えばいいんですが,Componentをどうやって組み込めばいいのかがわからなくて試行錯誤の繰り返しです.まだThrottling機能は使えないんですが,簡単なサンプルができたので皆さんの添削を期待してアップします. サンプルの挙動 防災科学研究所に定期的にアクセスして HTML::Selector::XPathHTML::TreeBuilder::XPathを使って最新震源情報を抽出 前回アクセスした時と内容が違っていたら出力 という簡単なものです. サンプルスクリプト いつもはこの節でスクリプト全文を載せているのですが,今回は先にトピックスの説明をしてみます. use warnings; no warnings qw(redefine); use FileH

    Gungho::Inlineを使ってみる - file-glob こと k.daibaの日記
  • YappoLogs: GunghoっていうWebクロウラーたんの件

    GunghoっていうWebクロウラーたんの件 なんか男前そうなクロウラーたんを発見したお 資料はhttp://www.slideshare.net/lestrrat/gungho-swarmage-pocomdba/を見るべし。 ちなみに、これ書くのに使ったGunghoはVersion 0.09001 のCPANの。 概要 GunghoはPlaggerっぽいwebクロウラーたんです。なのでGunghoの名前空間以下にあるモジュールとかを個別に使おうとしたら大変です。 Gunghoのアーキテクチャにそった一道な動作をさせるのがいいはず。 設定はConfig::Any使ってるので、色んな形式のを使えます。 Providerにより収集URLを取得し、EngineがHTTPでコンテンツを取得し、Handlerで取得したコンテンツを処理します。 Provider,Engine,Handlerは、そ

  • Gungho-0.09008

    The London Perl and Raku Workshop takes place on 26th Oct 2024. If your company depends on Perl, please consider sponsoring and/or attending.

    Gungho-0.09008
  • Perlメモ/Gungho/簡単なRSSクローラ - Walrus, Digit.

    Gunghoでもっともカスタムメイドの機会が多い部品は、プロバイダとハンドラです。「何を取得したいか」「取得してどうするのか」という用途に密接にかかわる部品だからです。ここではサンプルとして、データベースをストレージとした、RSS(フィード)クローラを作ってみることにします。 Gunghoの概要や情報源についてはPerlメモ/Gunghoを参照してください。 このフィードクローラは、次のような動作をします。 データベースに、フィード情報を保持するfeedテーブルとエントリ情報、コンテンツを保持するentryテーブルがあります。 フィードの取得 フィードテーブルから、未取得、または最終取得から1時間経過したフィードのURLを読み出します。 読み出したフィードを取得します。 取得したフィードから、エントリ情報を抽出します。新しいエントリURLがあれば、entryテーブルに追加します。 エントリ