タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

htmlとperlに関するclonedのブックマーク (2)

  • Web::Scraper プレゼン@YAPC::EU: blog.bulknews.net

    Web::Scraper プレゼン@YAPC::EU YAPC::Europe でウィーンにきています。1日目の夕方に Web::Scraper のプレゼンをしました。 時間が20分なのに前半に時間をかけすぎて尻きれトンボになってしまいましたが、いろいろフィードバックをもらえたのでよかったです。 ウィーンを観光する時間はとれなそうですが、ドナウ川の周りを散歩してみて、古い建物が見事に街中にとけこんでいて、道路も広いしいろんなものが美しい街です。まわりがテラドイツ語で1人で店とかに入ると大変ですが、また機会があったらきてみたいですねえ。

  • HTML::Selector::XPath をリリース: blog.bulknews.net

    HTML::Selector::XPath をリリース CSS Selector in Perl とか subtech - Bulknews::Subtech - CSS selector to XPath あたりで議論していた CSS 2 Selectors to XPath コンパイラなモジュールをつくって、CPAN に HTML::Selector::XPath としてリリースしました。 使い方は naoya さんが先に書いてますが、HTML から正規表現を使うことなくスクレイプするのに便利。たとえば Mixi にログインしてマイミク最新日記と、1件目のタイトル、文を抜き出すコードが、以下のようにかけます。 #!/usr/bin/perl use strict; use warnings; use utf8; use Encode; use HTML::Selector::XPat

  • 1