my $doc = $parser->parse_html_string($html, {encoding=>'utf-8'}); してから print $doc->find('//body/*')->shift->toString(0, 'utf-8'); とか。(文字列操作で前後を削るのはDOMらしくないので) / ♥ は parse_html_string だけでも解釈できた。

kitskits のブックマーク 2009/04/05 15:25

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

XML::LibXML で HTML の一部をパースする

    XML::LibXML::parse_html_string で HTML の一部、たとえばブログ記事の文のみとか、をパースしようとして無駄に苦戦してしまったのでメモ。 以下のような、DOCTYPE 宣言もなければ html/body 要素もないけど、...

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう