perlでのスクレイピング関連をメモしていきたいと思います。 まずスクレイピングするときに行なう処理は、ページを取ってくることです。 普段は、URLをブラウザのURL欄に入力し、ブラウザがHTTPでサーバにアクセスしてページを取得しています。 この処理をperlで行なうようにします。 使用するモジュールは、次の二つがあります。 LWP::Simple LWP::UserAgent これらのモジュールは、ブラウザと同様にHTTPでサーバにアクセスしてページを取得する機能があります。 それぞれの使用例は下記のようになります。 #!/usr/bin/env perl use strict; use warnings; use LWP::Simple; my $url = 'http://yahoo.co.jp/'; # LWP::Simpleの「get」関数を使用 my $html = get(