HTML-TokeParser-Simpleを使ってHTMLタグを除去する トップ 差分 一覧 ソース 検索 ヘルプ PDF RSS ログイン カテゴリ[Perl] ほぼPODのサンプルまんまだけど、HTML::TokeParser::Simpleを使ってHTMLのタグを除去する。 use HTML::TokeParser::Simple; print remove_html('htttp:://yusukebe.com./'); sub remove_html{ my($url) = shift @_; my $text; my $p = HTML::TokeParser::Simple->new(url => $url); while(my $token = $p->get_token){ next unless $token->is_text; $text = $text . $to