タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

unicodeと岩永信之に関するkkamegawaのブックマーク (1)

  • GetUnicodeCategory(int codePoint) を提案してみた

    今日は、.NET で、U+10000 以上のコードが割り当たってる文字の Unicode カテゴリー判定をする方法について。 提案を出したらそのままプルリクを出すことになった話。 背景 U+10000 以上の文字 Unicode について詳細は、昔書いた記事があるのでそちらを参照。 Unicodeとは? その歴史と進化、開発者向け基礎知識 Unicodeと、C#での文字列の扱い ここではさらっと。 U+10000 以上に割り当たってる文字は、要するに、以下のようなものです。 Unicode 設計当初に想定していなくて、後から「追加面」(supplementary planes)として定義した UTF-16 だと1文字で表せない なので、サロゲート ペア(surrogate pair: 代理対)っていう2文字1組のコードで表す UTF-8 だと4バイト文字になる 一部のマイナーな漢字、マイナ

    GetUnicodeCategory(int codePoint) を提案してみた
    kkamegawa
    kkamegawa 2018/01/22
    “「Visual Studio でリファクタリング機能を使えばほんとに一瞬」。 しかし、そこには罠があったのです。” / 孔明の罠w。条件コンパイルじゃなくて、csprojだと気付かないよなぁ。
  • 1