タグ

2009年9月24日のブックマーク (1件)

  • 文字のエンコード

    4.8.1. 文字のエンコードとは長年に渡って、米国では ASCII 文字セットを使って文字のやり取りをしてきました。 米国のシステムは基的に ASCII をサポートしているので、簡単に英語の文字で やり取りできます。 残念なことに、その他言語の文字の大半を扱うには ASCII ではまったく力不足です。 これまでずっと、さまざまな国でいろいろなテクニックを使って、さまざまな言語 で文字をやり取りしてきました。このことが、ますます相互につながりを持ちつつ ある世界で、データをやり取りすることを困難にしています。つい最近、ISO は ISO 10646 を整備し、「Universal Mulitple-Octet Coded Character Set(UCS)」としました。 UCS は全世界の文字それぞれに対して、31 ビットの値を定義した符号化文字集合です。 UCS のはじめから 65