前回記事 Web::Scraperを使ってみた - ragutarouの日記 の発展形。 "see more"というリンクがなくなるまでリンクを辿りデータを取得していく。 #!/usr/bin/perl use strict; use warnings; use Web::Scraper; use WWW::Mechanize; use URI; use YAML; my $url = new URI('http://cdbaby.com/top/223'); my $mech = new WWW::Mechanize; $mech->add_header(Connection => 'keep-alive'); $mech->get($url) or die $!; # Scrape my $scraper = scraper { process 'div.albumbox>h3>a',
![2008-01-21](https://cdn-ak-scissors.b.st-hatena.com/image/square/06a15c64ba0ceec233d86d71001ebb29a9dcbf5d/height=288;version=1;width=512/https%3A%2F%2Fcdn.blog.st-hatena.com%2Fimages%2Ftheme%2Fog-image-1500.png)