文字コードに関するyyyskeのブックマーク (2)

  • 全角マイナスとか全角チルダとかの文字化け: IT技術屋だんきちのブログ

    Javaやったり業務設計やったりDB設計やったりプロジェクトマネジメントやったりコンサルタントやったりのIT技術屋だんきちが、日々の雑感を記録したり、備忘録に使ったり、某プロ野球団の結果に一喜一憂したり、読んだの記録にしたりするブログ。 文字化けって技術屋さんにはよく通る道ですよね。 いろんなシステムで結構文字化けって放置されてるのが多々あるんですが(僕はよくそんな現場に投入される。。。)、原因は千差万別で、PHPとかJava内でわざわざ違う文字コードに変換してたり、EUCで構築したDBにシフトJISの文字列つっこんでたり、DB接続URLで指定すれば直ったり、HTMLにMETA指定してなかったり、モジュールアップロード時にASCIIモードFTPであげてやがったり、etc.. ここでよくあった、Javaにおいて全角マイナス(全角パイプとかも)が化けてしまう、全角チルダ(~)が波ダッシュ(全

  • CP932とは : JavaA2Z

    Windowsでの正しい文字コード。 Windowsの文字コードは、一般的には「シフトJIS」だが、正しくは「CP932」である。 「MS932」とも言う。 CP932は、シフトJISを拡張したものである。 ただし、基的には文字コードとしての違いはない。各文字の「整数値としての値」が異なることはない。 違いが現れるのは、他の文字コードへと変換する場合である。 他の文字コードへと変換する場合、「~」や「-」といった一部の文字が、異なる整数値へと変換される。 たとえばUnicodeへと変換する場合、以下のように変換される。 ■「~」 ・シフトJIS:0x81,0x60→Unicode:0x301C ・CP932:0x81,0x60→Unicode:0xFF5E ■「-」 ・シフトJIS:0x81,0x7C→Unicode:0x2212 ・CP932:0x81,0x7C→Unicode:0xF

  • 1