タグ

!tumblr-techとIVSに関するtyruのブックマーク (3)

  • IVSというかUnicodeに見る日本政府のダメな感じ

    Life with Web Browser Engine (Gecko, WebKit and etc), Mobile and etc. UnicodeでのIVS (Ideographic Variation Sequence) の倒れそうなお話 IVS (要は異体字のサポートね) ってのはUnicode 5.1で導入されたもので、簡単に言ってしまえば、"渡辺"の"辺"っていろんなバリエーションがあるじゃない?で、それをどうにかできるものなんだよね。それだけ聞くと、おぉ!いいじゃない?って思うんだけど、まぁ、聞け "辺"の例は、この日経の記事にあるけど、これはわかりづらいから、もっと簡単な例をだす。 U+53DFの異体字一覧があるわけだけど、なんか気付かない?。同じ文字としか見えないものがダブってるだけだよね。 Adobe-Japan-1ってのは、その名の通りAdobeのフォントで定義さ

    IVSというかUnicodeに見る日本政府のダメな感じ
  • Java 6 でIVSを比較すると何が起こるか - yanok.net

    Java 6が対応しているUnicodeのバージョンは4.1だそうです 【追記: 後で確かめたら4.0だそうです。私の思い違いでした _o_】。IVSに使われる面0Eのvariation selector (異体字セレクタ)はこのバージョンには既に入っています。なので、最新IVDの知識は期待できないとしても、variation selectorを無視するくらいの処理はひょっとしたら入っていてくれないかな、と思ってちょっと試してみました。 まず、Stringクラスの挙動から。まあ、何が起こるかは大体想像できるのですが、一応確認しておきましょう。 こんな風な文字列があるとします。 String nonIvs = "与太郎"; String ivs1 = "与\uDB40\uDD00太郎"; String ivs2 = "与\uDB40\uDD02太郎"; ここで、\uDB40\uDD00という

  • 日経BP

    株式会社 日経BP 〒105-8308 東京都港区虎ノ門4丁目3番12号 →GoogleMapでみる <最寄り駅> 東京メトロ日比谷線「神谷町駅」4b出口より徒歩5分 東京メトロ南北線 「六木一丁目駅」泉ガーデン出口より徒歩7分

    日経BP
  • 1