タグ

2008年2月3日のブックマーク (2件)

  • CPAN DateTime::Formatまとめメモ « ku

    こないだ MechanizedSeleniumでtwitterからnowaに投稿 を作ったときにメモったままそのままにしてたのを投稿。 perlだと DateTime::Format::* を使って my $str = "Tue, 01 May 2007 03:08:27 +0000"; my $dt = DateTime::Format::HTTP->parse_datetime($str); $dt->>epoch; で全部解決だけど日付フォーマットの名前がわからないとどのモジュールを使えばいいのかわからない。というわけでメモ。 DateTime::Format::HTTPのドキュメントにいくつかのフォーマットとその名前がリストされていてわかりやすかったです。 ISO8601 2006-11-22T18:37:34+0000こんなやつ。XMLRPCで日付を渡すときに使います。 My

  • WWW::Mechanize::AutoPager+Web::Scraperで複数ページにまたがるデータを扱う - bits and bytes

    AutoPagerizeのSITEINFOに含まれている、次のページへのリンクを示すXPathはAutoPagerize以外の用途でも使うことができます。 CPANにこのSITEINFOをパースすめたるの HTML::AutoPagerize - Utility to load AutoPagerize SITEINFO stuff というモジュールがあるのは知っていたのですが、ページのロードと次のページのURLの解決もやってくれる WWW::Mechanize::AutoPager - Automatic Pagination using AutoPagerize というモジュールがあるのはさっき知りました... このモジュールを使うと、MechanizeでロードしたページがAutoPagerizeのSITEINFOに記述されていれば、自動的にSITEINFOのnextLinkを参照して