http://d.hatena.ne.jp/naoya/20090911 ここで読んだはてなの本文抽出で使用されているという ExtractContent WEBの本文をperlを使って、抜き出すライブラリらしい。 これまで自分のサイトなどでは、simple_html_dom.php を使って、HTMLをパースしたものを正規表現で色々やっていたので、 こんな便利なものがあるなら!使ってみたい!とさっそく試す。 http://perl-mongers.org/2008/10/extract-content-from-html.html 初perlなので、cpanなど使い慣れず、四苦八苦したけど 最終的には下記手順で無事出来ました。 1.CPANのインストール http://y-kit.jp/saba/xp/cpan.htm 1-1.cpanとコマンドを打つ #cpan 1-1下記のような質問