perl で日本語を含む XML を扱う場合の留意点(苦労話)をご紹介します。 まだ方法論として体系だったものになっていないのですが、処理をする際になかなか情報が見つからなかったので、参考として未完成のまま公開していきたいと思います。 色々試した環境は、perl 5.6.1 です。perl 5.8 だと色々な問題が多少は改善されているかも知れません。 目次 ・文字コードは UTF-8 でなければならない ・読み込みは XML::Simple、書き出しは print でゴリゴリが一番てっとり早い ・Jcode.pm はUTF-8 のコード変換には色々問題があった ・ハイフンの全角半角変換と文字化けの問題 及び 変換用関数 文字コードは UTF-8 でなければならない perl の場合、どんなXMLパーサーモジュールを使う場合でも、ベースに XML::Parser モジュールが使用されているこ