タグ

ブックマーク / digit.que.ne.jp (1)

  • Perlメモ/XMLの解析 - Walrus, Digit.

    XMLファイルを正規表現のみでタグとテキストの配列に変換する方法です。 簡易的なXMLパーサーを作る時には、まずこの作業をしてしまうと後の処理は簡単になるでしょう。 なお、対象のXMLデータはeucコードにしておいてください。 このルーチンおよび正規表現は、大崎氏の「Perlメモ」にある「(HTML)タグを削除する」をベースに、XMLの解析用にアレンジしたものです。 このルーチンが役立ったとすれば、その功績の9割までは大崎氏のものです。 次のサブルーチンは、引数にXML文字列を取り、タグと文字列に分けた配列を返します。 sub xml_to_array { my $xml = shift; my $tag_regex_ = q{<[^"'<>]*(?:"[^"]*"[^"'<>]*|'[^']*'[^"'<>]*)*(?:>|(?=<)|$(?!\n))}; my $comment_reg

  • 1