タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

unicodeに関するstfhのブックマーク (2)

  • 追記: UTF-8 vs. ISO-10646 : 404 Blog Not Found

    2005年12月20日14:07 カテゴリiTechLogos 追記: UTF-8 vs. ISO-10646 文字集合(Character Set)と符号化(Encoding)について、より適切な表現と追補すべきネタがあったのでEntry quinta essentia - Character Set vs. Encoding となって、U+7FFFFFFF まで許すという話もあって、ややこしさが増す。符号化(Encoding) は 文字集合(Character Set) の乗りものである こう言えば一目瞭然ですね。 UTF-8という「乗り物」には2^31個の座席があるが、17^2^16個の座席しか今では使わないことになっています。別の「乗り物」であるUTF-16にはそれしか座席が用意できないのがその理由です。 UTF-8Perl 実は、Perlで扱う"utf8"というのは、ISO-1

    追記: UTF-8 vs. ISO-10646 : 404 Blog Not Found
    stfh
    stfh 2005/12/20
  • 備忘録: Unicode, UCS, and UTF : 404 Blog Not Found

    2005年12月20日11:45 カテゴリiTechLogos 備忘録: Unicode, UCS, and UTF まだ混乱が収まっていらっしゃらないようなので、備忘録を兼ねてここでまとめておきましょう。 電脳社会の日語 加藤 弘一 quinta essentia - del.icio.us買収, Yonahあってるかな? Character Set (文字集合) vs. Encoding (符号化) まずこの二つが別物だということを抑えましょう。UCSというのは名前からわかる通り、Character Set (文字集合)です(とはいえ、Unicode.orgのGlossaryを見ると、符号化の一手段にも見えなくはない)。この段階では、各文字は「背番号」を持っているに過ぎません。狭義の「Unicode」はこの「背番号」を指します。 これをどう実際のデータにするのかがEncoding (

    備忘録: Unicode, UCS, and UTF : 404 Blog Not Found
    stfh
    stfh 2005/12/20
  • 1