タグ

sjisとutf8に関するBoBppのブックマーク (2)

  • PHPの SJISと SJIS-WINの違い

    SJIS-WINとは? PHPで文字コードとして「SJIS-WIN」を指定すると、Microsoftが拡張したShift_JISであるWindows-31Jが使われる。 Windows-31Jは、Microsoftが「JIS X 0208-1990」をベースに、NECとIBMの独自拡張文字の一部(一般的にはSJISの「機種依存文字」と呼ばれる?)を取り込んだ文字コード。 (参考:Microsoftコードページ932 - Wikipedia) SJISとSJIS-WINで何が違うの? SJIS-WINの方が文字が多い。 よく使うところでは、下記のような文字はSJISーWINにはあるがSJISにはない。 丸数字 (①②③...⑳)ローマ数字 (ⅠⅡⅢ...Ⅹ、ⅰⅱⅲ...ⅹ)カッコ付きの株 (㈱)はしご高[はしごたか] (髙)たつ崎[たつさき、たちさき] (﨑) SJIS-WINにはあるがSJ

  • EUC-JPからUTF8への変換の際にCP51932を使う - longkey1's blog

    PHPの文字エンコーディングでEUC-JPからUTF-8へ変換した時に色々ハマったのでメモ。 今までeucJP-winとSJIS-winを使っておけばOKって思ってたけど、実際は色々違うみたい。 検証する文字列 纊あいa忞寬①㈱Ⅲ㌔髙アイウ 検証した時に使ったコード $str = "纊あいa忞寬①㈱Ⅲ㌔髙アイウエオ"; echo "EUC-JP > UTF-8\n"; echo 'EUC-JP = ' . mb_convert_encoding($str, 'UTF-8','EUC-JP') . "\n"; echo 'eucJP-win = ' . mb_convert_encoding($str, 'UTF-8','eucJP-win') . "\n"; echo 'CP51932 = ' . mb_convert_encoding($str, 'UTF-8','CP51932') .

  • 1