タグ

xmlと文字コードに関するtshimuranのブックマーク (1)

  • Unicodeでも発生する文字化けの危機と回避

    漢字やひらがななど、数多くの文字を持つ日において、文字化けはいまだに避けて通れない問題だ。XMLでは、こうした文字化けを防止するための仕組みが備わっているが、それでもなお完全に封じ込めることはできていない。その理由について解説しよう。 文字化け防止ルールを持つXML XMLは、安全かつ安定した情報交換の手段として利用できることを目的にした、よく考えられたメタ言語である。XMLより以前のSGMLなどと比較して、格段の進歩が見られる。例えばSGMLでは、SGML文書を記述するためにどんな文字コード系を使用するか、標準的な規定が何もなかった。そのため、あるSGML文書が、ほかのシステムで正常に読めるかどうか、何の保証もなかったと言ってよい。これに対して、XMLでは文字コード系に関しても明確なルールを導入することで、交換性を保証するようになっている。これは、不特定多数の利用者が相互に情報を交換す

    Unicodeでも発生する文字化けの危機と回避
    tshimuran
    tshimuran 2010/08/14
    解釈によっては、ユニコードであっても文字化けする
  • 1