タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

perlとxmlに関するnekobaraのブックマーク (3)

  • use encoding 'utf-8' & encoding::warnings: blog.bulknews.net

    use encoding 'utf-8' & encoding::warnings Perl ネタ。 XML まわりなんかを扱うときについて回る UTF-8 フラグ (Unicode フラグ)をどう落とすか的ネタがもりあがっていますねぇ。このネタは拙書の Blog Hacks でも 1 Hack さいて解説してあります。 Blog Hacks ―プロが教えるテクニック&ツール100選posted with amazlet on 05.09.30宮川 達彦 伊藤 直也 オライリー・ジャパン (2004/08/07) 売り上げランキング: 20,714 Amazon.co.jp で詳細を見る たしかに内部的に UTF-8 フラグを落としてバリバリつなげちゃえば、場当たり的に楽は楽なんだけど、内部的に Unicode フラグをもったまま処理して、最後に出力するときに落とす(encode する)と

  • XML::Simple におけるパーサーの実行速度比較 - naoyaのはてなダイアリー

    XML::Simple は、どんな XML でも Perl のデータ構造に自動変換してくれるかなり便利なモジュールなのですが、中でツリーを解析したりいろいろやってるせいもあって、速度的にはあまり誉められたものではありません。以前に Perl で XML の処理はどれが速いかベンチ で比較したときには、随分遅いなという印象でした。 ただ、XML::Simple はその中で利用するパーサーを色々切り替えられるようになっています。じゃあそれを切り替えたら少しは速くなるんだろうかと気になってベンチを取ってみました。 XML::Simple は $XML::Simple::PREFERRED_PARSER に任意の SAX パーサーを指定するとそれを使ってパースするようになっています。 XML::LibXML::SAX XML::SAX::Expat XML::SAX::ExpatXS XML::P

    XML::Simple におけるパーサーの実行速度比較 - naoyaのはてなダイアリー
    nekobara
    nekobara 2005/08/01
    XML::Simpleのベンチ
  • XML::RSS::LibXML を使って続・Perl で XML の処理ベンチ - naoyaのはてなダイアリー

    XML::RSS::LibXML uses XML::LibXML (libxml2) for parsing RSS instead of XML::RSS' XML::Parser (expat), while trying to keep interface compatibility with XML::RSS. CPAN に XML::RSS::LibXML というモジュールが新着で上がっていました。XML::RSS は内部で expat を使う XML::Parser を XML パーザーに使っています。が、これよりも libxml2 を使う XML::LibXML の方が速くて効率が良い、ということで XML::RSS のインタフェースはそのままにパーザーを XML::LibXML に置き換えたのがこのモジュールです。(ちなみに 100% XML::RSS 互換ではないとの注

    XML::RSS::LibXML を使って続・Perl で XML の処理ベンチ - naoyaのはてなダイアリー
    nekobara
    nekobara 2005/06/15
    XML処理のベンチマーク
  • 1