[B! unicode][岩永信之] kkamegawaのブックマーク

kkamegawa id:kkamegawa

unicodeと岩永信之に関するkkamegawaのブックマーク (1)

GetUnicodeCategory(int codePoint) を提案してみた
今日は、.NET で、U+10000 以上のコードが割り当たってる文字の Unicode カテゴリー判定をする方法について。提案を出したらそのままプルリクを出すことになった話。背景 U+10000 以上の文字 Unicode について詳細は、昔書いた記事があるのでそちらを参照。 Unicodeとは？その歴史と進化、開発者向け基礎知識 Unicodeと、C#での文字列の扱いここではさらっと。 U+10000 以上に割り当たってる文字は、要するに、以下のようなものです。 Unicode 設計当初に想定していなくて、後から「追加面」(supplementary planes)として定義した UTF-16 だと1文字で表せないなので、サロゲートペア(surrogate pair: 代理対)っていう2文字1組のコードで表す UTF-8 だと4バイト文字になる一部のマイナーな漢字、マイナ
kkamegawa 2018/01/22
“「Visual Studio でリファクタリング機能を使えばほんとに一瞬」。しかし、そこには罠があったのです。”　/ 孔明の罠w。条件コンパイルじゃなくて、csprojだと気付かないよなぁ。

岩永信之

CoreFX

Unicode
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx