タグ

ブックマーク / diary.asuka.net (1)

  • ニコニコ動画をWeb::Scraperでスクレイプ - Magical Diary, beta version

    ニコニコ動画のタグごとにRSSを作るため、最初は以下のように正規表現でゴリゴリと処理していたが、イマイチ綺麗じゃない。 while($html =~ m{<p><a\s+href="watch/(\w+)">\s* <img\s+.*?src="(.*?)".*?>.*? <strong>((?:\d+分)?\s*\d+秒)</strong>.*? 再生:<strong>([\d,]+)</strong>.*? コメント:<strong>([\d,]+)</strong>.*? <a\s+class="video".*?>([^<>]*)</a></p>.*? <p.*?>([^<>]*?)</p>.*? <p.*?><strong>([^<>]*?)</strong></p> }gsx) { ... } 今回は Web::Scraper というモジュールを使ってみた。これは、CSSセレク

    sharaku3eyes
    sharaku3eyes 2007/10/14
    タグごとにRSSを吐くscrapingをしている。ニコニコ関連サービスを作る時に参考にする
  • 1