Java 文字化け Unicode 4.0 補助文字対応 † J2SE 5 からは内部文字コード(char型)が UCS-2 (完全16ビット)ではなく UTF-16 (サロゲートペアあり)となった。 Java プラットフォームにおける補助文字のサポート http://java.sun.com/developer/technicalArticles/Intl/Supplementary/index_ja.html ↑ char → byte 変換 † Shift_JIS(SJIS), Windows-31J(MS932) の異なる点のみ拾い出している。(一部逆変換の参考のために記載。) NEC拡張漢字、NEC選定IBM拡張漢字は除外。 Shift_JIS, ISO-2022-JP, EUC_JP は内部的には同じ変換表を使っているので割愛。 ここでは文字は UTF-8 で表記している。(U