perl で日本語を含む XML を扱う場合の留意点(苦労話)をご紹介します。 まだ方法論として体系だったものになっていないのですが、処理をする際になかなか情報が見つからなかったので、参考として未完成のまま公開していきたいと思います。 色々試した環境は、perl 5.6.1 です。perl 5.8 だと色々な問題が多少は改善されているかも知れません。 目次 ・文字コードは UTF-8 でなければならない ・読み込みは XML::Simple、書き出しは print でゴリゴリが一番てっとり早い ・Jcode.pm はUTF-8 のコード変換には色々問題があった ・ハイフンの全角半角変換と文字化けの問題 及び 変換用関数 文字コードは UTF-8 でなければならない perl の場合、どんなXMLパーサーモジュールを使う場合でも、ベースに XML::Parser モジュールが使用されているこ
![Perl で 日本語 XML を扱う](https://cdn-ak-scissors.b.st-hatena.com/image/square/e3bbf8a81c197c236fdc810a168047e59efb5984/height=288;version=1;width=512/http%3A%2F%2Fhole.sugutsukaeru.jp%2Fparts%2Fimg%2Fhole-logo-square.png)