タグ

ブックマーク / taichino.com (2)

  • Web::ScraperでHTML::Elementを抜き出したい件 – taichino.com

    もっぱらHTMLからのデータ抽出ではWeb::Scraperを使っているんですが、 時々タグの中身や属性ではなく、HTML::Elementを抽出したくなる時があります。 直感的には以下のような感じなのですが、動かなかったのでメモ書きです。 #!/usr/bin/perl use strict; use warnings; use LWP::Simple; use Web::Scraper; use YAML; my $content = get("http://google.co.jp/"); my $scraper = scraper { process '//title', 'title' => sub { # $_に入っているHTML::Elementを直接使いたい return $_; # だけど外部で参照できない }; }; my $res = $scraper->scrape

  • perlでモジュールのimportとunimport – taichino.com

    perlでモジュールをインポートする時に何気なく使ってるuse Hogeですが、調べてみると少し思ってたのと違ってたので、調べた事をメモしておきます。 use Hogeは実は標準関数useの呼出しを行っていて、その内容は以下と同等です。 BEGIN { require Hoge; # 中で更にdo Hoge.pmを呼び出す import Hoge; # Hoge::importを実行 } require Hogeは対応する.pmファイルを読み込み、importはHoge::importを呼び出します。requireされた時点でロードは完了して、Hoge.pmに定義されている関数等は使用可能です。じゃあimportで何をしてるかというと、読み込み元パッケージの名前空間にHoge.pm内の関数に対するエイリアスを定義する為に使われる事が多いようです。 逆にモジュールをunimportしたい場合

  • 1