タグ

ブックマーク / shimax.cocolog-nifty.com (1)

  • PHPで、いわゆる機種依存文字の文字コード変換(EUC-JP→UTF-8)にはまる - WEBプログラミング NOW!

    私が作るPHPのサイトは、大概、EUC-JPを内部エンコーディングと設定して作成しています。それで今まで特に困ったことはなかった(自動応答メールなどに「㈱」「髙」などの機種依存文字が含まれていると文字化けすることはありましたが、そのような場合、そのような文字を入力するユーザーの知識不足を問題視していることが実際多かったのですが・・・。)のですが、今回は困りました。 いわゆる機種依存文字(「①」「㈱」「Ⅱ」「㌔」など)をEUC-JPからUTF-8へ変換しようとすると、該当文字が「?」(クエスチョンマーク・はてなマーク)に化けてしまいます。変換不能状態です。我ながら今更ですが、mb_convert_encoding()関数において、「eucJP-win→UTF-8」のようににするとこれらの文字変換はうまくできるようになることが分かりました(=下記サンプルコードの方法2)。 ただし、「髙」「纊」

    PHPで、いわゆる機種依存文字の文字コード変換(EUC-JP→UTF-8)にはまる - WEBプログラミング NOW!
    dhalmel
    dhalmel 2008/02/07
  • 1