タグ

perlと文字コードに関するdigitalboxのブックマーク (2)

  • Perl 5.8.x Unicode関連

    -> 趣旨と注意書き -> UTF8フラグ? -> UTF8フラグとPerlIOレイヤ -> UTF8フラグのついた文字列を記述する -> Wide character in print ... -> Encode -> utf8::* -> use utf8; -> use encoding; -> use UTF8 と use encoding -> JcodeからEncodeへ -> 情報源 <- モドル 趣旨と注意書き Perl 5.8.x のUnicode 関連です。 正直、5.8.x は、ネタでしか使ってなかったので(ぉ、ちゃんといじったことがありませんでした。 使ってみると、よくわかんなくなったので、ちょっとまとめてみました。 今でもあんまりわかってないかもしれないので、内容は無保証です。 突っ込み歓迎。 Jcode、Encodeのメンテナの弾さんから、ご指摘いただいたので、

    digitalbox
    digitalbox 2011/08/10
    UTF8フラグについての解説あり。
  • perl utf8→sjisで文字化け - (゚∀゚)o彡 sasata299's blog

    2008年07月25日23:32 Perl perl utf8→sjisで文字化け 以前のEncodeモジュールの話に関連した話なんですが、 今日、ある症状が出て困っていました。utf8を、sjisにした際に「〜(波ダッシュ?)」や「−(全角のマイナス)」が文字化けしてしまったのです(;´Д`) とりあえずその場は「Unicode::Japanese使えば大丈夫だよ」と教えていただいて対処したんですが、どうにも府に落ちなくてちょっと調べてみました。そしたらありましたよ、解決策が.。゚+.(・∀・)゚+.゚ もともと、 encode('shift_jis', decode_utf8($str)); こんな感じでutf8からshift-jisに変換していました。これを encode('cp932', decode_utf8($str)); とすることで、無事文字化けすることなく変換できました。

  • 1