タグ

HTML-TreeBuilderに関するC_Lのブックマーク (2)

  • Perlで壊れたHTMLを補完する

    タイトルの問題ですが、自分はよく以下のような関数でやります。 HTML::TreeBuilderのas_HTML()がうまいことやってくれます。 (実際にはHTML::Element::as_HTML()ですが) sub _complement_html { my $broken_html = shift; my $html = do { no strict 'refs'; no warnings 'redefine'; local *HTML::Entities::encode_entities = sub {}; local *HTML::Entities::decode = sub {}; my $tree = HTML::TreeBuilder->new; $tree->parse( $broken_html ); $tree->as_HTML; }; $html =~ s#<ht

    C_L
    C_L 2010/05/03
    HTML::TreeBuilderでパースさせることで中途半端なHTMLを補完・再生成
  • PerlAndLWP

    ※[文字列1, 文字列2...]は、無名配列 * 7.2.1. Start-Tag Tokens $token->[0] == "S"のときトークンは、 Start-tag ["S", $tag, $attribute_hash, $attribute_order_arrayref, $source] $tag タグの名前、小文字 $attribute_hashref $attribute_order_arrayref このタグのアトリビュートをエンコードするハッシュへのリファレンス アトリビュートのなまえ の小文字標記がハッシュへのキーとなる $attribute_order_arrayref 配列のアトリビュート名(小文字)へのリファレンス $source オリジナルの HTMLソース <IMG SRC="kirk.jpg" alt="Shatner in r&ocirc;le of

  • 1