● 国際化ドメイン名で互換漢字が使えない理由 Unicode正規化が規格に盛り込まれている例として、国際化ドメイン名(IDN)が挙げられるだろう。ドメイン名はいわばインターネット上の番地表示だが、従来はラテン文字のaからz(大文字/小文字は区別しない)、数字の0から9、それにハイフン「-」の計37文字だけに限定されていた。国際化ドメイン名とは、これをUnicodeの範囲に拡大し、それにより世界の人々が自分の使っている言語でドメイン名を表現できるようにしようとするものだ。具体的にはインターネットの規格であるRFC 3490~3492の3つで規定されている。 ここでは「Punycode」(RFC 3491[*1])と呼ばれる一定の規則に従って、Unicodeの文字列を現在使われている37文字に変換することにより国際化ドメイン名が実現されている。しかしこの変換をする前に「Nameprep」(RF
Acrobat 9のフォームフィールドは、IVS(Ideographic Variation Sequence)をサポートしている。 (Macの場合)controlキーを押しながらフォーム内をクリックし、メニューから「同じUnicodeの異体字」を選択すると、フローティング・ウインドウが表示される。入力した文字を選択し、フローティング・ウインドウをクリックすることで、グリフを選ぶことができる(下図)。……というやり方は、当て推量で試行錯誤して発見したのだが、どこかに説明があるのだろうか。 ちなみにIVSに対応したKozMinPr6N-Regularの6.004では、(一通りチェックしたが)字形の変更はなさそう。 Acrobat 9のフォームフィールドに、KozMinPr6N-RegularでU+845Bの「葛」を入力後、異体字パレット(と仮に呼んでおく)で「匕」形の「葛」に置換したのが、下
各種調査ノート Unicode Ideographic Variation Sequence の概要 † 用語 Ideographic Variation Sequence = IVS variation sequence を表すコード列 Ideographic Variation Collection = IVC IVS の集合 Ideographic Variation Database = IVD IVS と IVC に名前を付けるデータベース 大ざっぱな構造 平たく言えば、文字コードを細かく切って固定小数点実数にするだけの仕組み 三段階に管理スコープを分ける 一個 = IVS 部分 = IVC 全体 = IVD IVS 固定小数点実数値の文字コード(に名前を付けたもの) 一つの IVS に一種類の字形が対応 IVS の整数部分が「base character」 整数部分が同じ字を「
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く