タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

文字コードとwebに関するnnnnnhisakunのブックマーク (4)

  • サロゲートペア入門

    はじめに Windows VistaのJIS2004対応により、WindowsのUnicode環境で使用できる日語漢字の数が増えました。従来、12238字(Windows XP)だったのが13145字(Windows Vista)になり、907字追加されることになりました。これによって、JIS第3水準、JIS第4水準の漢字がすべてサポートされることになったのです(Windows XPまでは一部サポート)。 またWindows XPでも、パッチさえ当てれば、Windows Vistaと同じように追加907字を加えた13145字の漢字が使用できるようになりました。 ところが、この追加された907字の中には「サロゲートペア」という特殊な文字が304字あり、これらは今までのUnicodeの文字とは扱いが少し違います。この点について解説していきたいと思います。 対象読者 Unicodeでデータ処理

    サロゲートペア入門
  • Delphi 2009 と Unicode : 番外編 (サロゲートペア)

  • UTF-8 ‐ 通信用語の基礎知識

    Unicodeを1〜4オクテットに、または、ISO/IEC 10646を1〜6オクテットの不定長に変換する。 前者はRFC 3629で標準化されており、後者はこのRFCによって破棄された古いRFCであるRFC 2279にて仕様が規定されている。 このように、RFC 2279では1〜6オクテットまでの規定があったが、RFC 3629ではUnicode文字(U+0000〜U+10FFFF)だけの対応となり、1〜4オクテットの範囲だけしか規定されなくなった。 Javaでは実行ファイル(Javaバイトコードと呼ばれる)内部で実際に用いられている文字コードの符号化方法であり、Java以外でもInternet ExplorerやMicrosoft Wordなどで広く対応している。 ASCIIと互換性があり、かつ世界中の言語を容易に扱えるということで徐々に人気が高まった。 この方法を用いるとASCII文

  • 文字コード ASCII Windows Mac ISO8859 Unicode

    A. ASCII コード 名称 American Standard Code for Information Interchange の略。1963年、米国規格協会 (ANSI) が制定。 原理 コンピュータに必要な制御文字 (34個) や基的英数字記号の文字群 (94個) を、コンピュータが機械語レベルで扱う2進数 (0 または 1, ビット bit) で表現すると、2 の 7 乗 (128個、7 ビット) の範囲で収まります。この128個中の94個の文字は、英語が使用するアルファベットに相当します。 ISO 646 ASCII のままでは西欧諸国語に対応できないので、その中の 12 文字分を各国の事情に応じて入れ替えたものが生まれました。そのままでは、この 12 文字分に関して各国語版のデータに共通性はありません。これらを国際規格である ISO に登録したもの

  • 1