タグ

ブックマーク / daretoku-unix.blogspot.com (1)

  • perl における文字コードについて

    Perl における文字コードについて曖昧な理解だったので勉強がてらまとめてみる。 とあるPerlアプリケーションを修正したくて挙動をしらべたところ、length($str)が文字数じゃなくてバイト数を返しているのが原因と分かった。しかし、関連しそうなトピックをググっても、Perl に詳しい人がまとめた解説が多く引っかかるのだけど、基的なことが分かってない自分には高度過ぎてよくわからない。しかも perl 5.6 以前 -> 5.6 -> 5.8 あたりでドラスティックに変更されているようで、そのへんの事情に疎い自分はどの情報を信じればいいのかよくわからない。(が、一番わかりにくくなっている原因は "UTF8" と "Perl内部エンコーディング" の妙な交換可能性だと思う。まるでCのポインタと配列みたいだ) というわけで、主にEncode(3pm)で調べた結果をまとめておく。動作確認は

    laid-back
    laid-back 2012/03/29
    この記事で割と納得した
  • 1