コンテンツ抽出(本文抽出) Perl モジュール ExtractUniqueBlock の配布ページです。追加した方がよい機能、修正した方がよい機能などがありましたら、お気軽にご連絡ください。最終的には CPAN での配布を予定しております。 ダウンロード 最新版(0.01) ExtractUniqueBlock_beta_0.01.zip ExtractUniqueBlock_beta_0.01.zip に含まれるファイルは以下の通りです。 ExtractUniqueBlock.pm コンテンツ抽出(本文抽出) Perl モジュール ExtractUniqueBlock 本体 asahi_rss.pl asahi.com の RSS を取得してコンテンツ抽出(本文抽出)を行うサンプル local_directory.pl ローカルの HTML 群からコンテンツ抽出(本文抽出)を行うサンプ