タグ

code pageとcp932に関するdoinnのブックマーク (1)

  • Windows-31J の重複符号化文字と Unicode

    Windows-31J (マイクロソフト Code Page 932) では重複符号化されている文字があります。ここでは、その重複符号化されている文字の変換をどのように行うかについて扱っています。 マイクロソフトの Code Page 932 の文字コード変換では重複符号化されている文字は Unicode への変換で同一のコードポイントへ変換され、Unicode からシフトJISに変換する際には特定のコードポイントが用いられるようになっています。 基的なルールは次のようになっていて、1 から順番にルールが適用されます。 2区にある文字は2区のコードポイントを用いる 13区にある文字は13区のコードポイントを用いる 115~119区にある文字は115~119区のコードポイントを用いる 具体的なコードポイントを表にすると次のようになり、Unicode からシフトJISへの変換では、強調表示の

  • 1