タグ

ブックマーク / www.mirai-ii.co.jp (1)

  • 異体字セレクター

    異体字セレクターは、UnicodeおよびISO/IEC 10646で、異体字を表現するための機能文字です。 あるUnicode文字に後置することでバリエーション番号を与え、幾種類かの異体字を選択可能にする技術です。Unicodeの漢字は「統合」(あるいは包括)されていることを特徴としますが、その統合された様々な異体字を区別するために追加された仕様です。 UnicodeおよびISO/IEC 10646には、モンゴル文字用と、汎用の異体字セレクターが存在します。 漢字は、汎用の異体字セレクターのうち17番以降を使用することになっています。 U+E0100〜U+E01EF ‐ VARIATION SELECTOR-17〜256 [文字] [異体字セレクター] のように、後置で使用します。 UTF-8なら、漢字は3ないし4バイト、異体字セレクターは4バイトなので、一文字を計7から8バイトで正確に表

    mickn
    mickn 2010/04/01
  • 1