タグ

iconvとcp932に関するtmsanrinshaのブックマーク (1)

  • CP932変換表の問題が顕在化する例 - yanok.net

    JIS X 0208のシフトJISとUnicodeとの変換の問題として、CP932 (Windows-31J)の問題はよく知られています。書籍『プログラマのための文字コード技術入門』にも記しました。Windowsに実装されているUnicodeへの変換表が、標準の定義とずれている問題です。 この問題は、使用頻度の高さから、波ダッシュ「〜」(1面1区33点、SJIS 8160)が化け る問題としてよく知られています。 しかし、波ダッシュ以外にも大きな影響を受けている文字(記号)があります。 双柱「‖」1面1区34点 (SJIS 8161)は、垂直線が2並んだ格好をしている記号です。文字名はDOUBLE VERTICAL LINEといいます。Unicodeで対応する符号位置はU+2016です。この記号はCP932変換表の影響を受けています。CP932変換表では、U+2016でなく平行記号 (P

    tmsanrinsha
    tmsanrinsha 2014/05/28
    ローマ数字があってもiconv -f SHIFT_JISX0213 -t UTF-8 hoge.txt だと文字化けしない。EUC-JPへの変換はできない
  • 1