タグ

JavaとUnicodeに関するU40のブックマーク (3)

  • @IT:Javaの文字化け対策FAQ(3)

    JSP/サーブレット・プログラミングで誰もが一度は遭遇するトラブルが文字化けだ。予期せぬ文字化け発生に、デバックに苦労した経験を持つ読者も多いだろう。連載では、JSP/サーブレットにおける文字列の扱いの基礎を復習した上で、文字化けの解決策を要点よく解説していく予定だ。(編集部) 質問1:ファイルやメール、DBで「~∥‐¢£¬」が文字化けします 解答: 各種文字コードとUnicodeの間の変換ルールを見直しましょう 前回説明したとおり、「~∥‐¢£¬」の文字化けは、「Unicodeと各種文字コード間の変換ルールの違い」によって発生するものだ。これらの文字について、Windows-31JとUnicode間の変換ルールは、その他の文字コード(Shift_JIS、EUC_JP、ISO-2022-JPなど)に用いられる変換ルールとはまったく異なる。よって、Windows-31Jとその他の文字コード

    @IT:Javaの文字化け対策FAQ(3)
  • An Unicode vendor-specific character table for japanese (日本語のUnicodeベンダ依存文字表)

  • 文字コードについて(シフトJISの問題)

    文字コードをシフトJISで開発し、Windowsのサーバで動かす場合の文字コード問題について示します。 厳密にいうとWindowsが扱う文字コードは、シフトJISでは、ありません。MS932です。または、コードページ CP932ともいいます。MS932は、マ社がシフトJISを拡張して定義したコード体系です。 で、ここで何が問題になるかというと、クライアントへの出力をcharset="Shift_JIS"とか定義して、アプリケーションサーバーなど が一生懸命シフトJISで出力しようとすると、ある文字列が文字化けするのです。ようは、MS932にある文字コードはシフトJISには、ないので、'? 'で出力されるということです。なお、OC4JやJBuilderで利用するtomcatは、MS932で出力しようとするので、あんまり文字化けしませ ん。 Java内部で扱う文字コードは、Unicodeです。

  • 1