タグ

ブックマーク / private.ceek.jp (1)

  • Encode と UnicodeJapanese - Ceekz Logs

    昨年の半ばから、日語変換には Unicode::Japanese を使っていたわけですが、よく考えると、単純に UTF-8 EUC SJIS 間の変換にしか使わないので、標準モジュール(Perl 5.8)である Encode を使うことにした。 自分の環境や使い方では、なんと Unicode::Japanese より Encode の方が、だいたい 10分の1 の CPU時間 で処理できることがわかった。 ただ、問題が無い事も無く、文字コードを判定して変換するのが上手く行かない場合が結構多い。 use Encode; use Encode::Guess qw/ euc-jp shiftjis 7bit-jis /; Encode::from_to($value, 'Guess', 'euc-jp'); こんな風に書けば、一般的には文字コードを判定して変換することができる(ほにゃららを E

    takuya_1st
    takuya_1st 2008/12/05
    なるほど。EnCode.pmってそう使うのか
  • 1