タグ

2009年11月2日のブックマーク (2件)

  • 添付資料

    コード変換規則 eucJP-open と UCS との間のコード変換規則を次に示す. 各ファイルは コードポイントの範囲・文字種類ごとに分けられ, eucJP-open のコードポイント UCS-2 のコードポイント の形式で記述されている. Microsoft Windows 3.51 式の変換 Microsoft Windows 3.51 式の変換を採用する場合, 次のコード変換規則を 用いる. この場合,iconv コマンドおよび関数の引数に指定するコードセット名は eucJP-* とする. JIS X 0201 の範囲 (ASCII と併用する場合) JIS X 0208 漢字 (Windows NT 3.51 式の変換) JIS X 0212 補助漢字 (Windows NT 3.51 式の変換) NEC 特殊文字 ユーザ定義文字 IBM 拡張文字 JIS X 0221 式の変換

  • JavaでWindowsなEUC-JPの文字化けを防ぐ - ooharakの日記

    文字コードについて - ooharakの日記 の続き。結論が出ていないが、考察過程。 Javaでサポートされているエンコーディングと、x-eucJP-msとの差 実際にJavaで変換を掛けた場合に、文字化けが起こるかどうかというのは、理屈の上では、区点やISO 2022などをベースに机上だけで考えることができるはずである。 だけども、どこかでボタンを掛け違ったままで考えを進めていくと、後で間違いに気づいてからの手戻りが大変そうなので、まず実際にJavaで動かして試してみることにした。 実装には、こういった試行錯誤系にはうってつけのJRubyを使う。 比較対照の規範としては、今回x-eucJP-msを使う。理由は、今回使用するデータベースPostgreSQLが、EUC-JPを指定した場合には、実際にはx-eucJP-msで動くようになっているとされるからである。 x-eucJP-msには、「

    JavaでWindowsなEUC-JPの文字化けを防ぐ - ooharakの日記