ishisakaのブックマーク / 2014年3月14日

ishisaka id:ishisaka

2014年3月14日のブックマーク (3件)

http://www.unicode.org/Public/7.0.0/ucd/EastAsianWidth-7.0.0d4.txt
ishisaka 2014/03/14
これを機械的にIFかSWITCHに変換すれば良いと。。

unicode

I18n
リンク
東アジアの文字幅 - Wikipedia
この記事には複数の問題があります。改善やノートページでの議論にご協力ください。出典がまったく示されていないか不十分です。内容に関する文献や情報源が必要です。（2017年4月）独自研究が含まれているおそれがあります。（2017年4月）出典検索?: "東アジアの文字幅" – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL 「東アジアの文字幅」（英: East Asian Width）は、Unicode標準の附属書 (英: Unicode Standard Annex) の一つ。Unicodeに収録されている各文字の文字幅に関するヒントを与える East_Asian_Width 参考特性（英: informative property）を定めている。概要[編集] 東アジアのマルチバイト文字コード規格は必
ishisaka 2014/03/14
.NETにライブラリがないですか、そうですか

unicode

文字コード

I18N
リンク
全角半角混在の文章で 1 行に半角何文字分あるか調べる方法
「ソースコードは 1 行あたり 80 文字以内」とか「コミットログは横幅 72 文字以内」とか、文字数に関するルールはいろいろある。ルールを徹底するには機械的に判定したい。と思って、簡単なスクリプトを書こうとした瞬間、意外と「1 行あたりの文字数」をカウントするのが難しいことに気付いた。たとえば、「あA」は「全角 1 文字＋半角 1 文字」なので半角 3 文字分としてカウントしたい。しかし、UTF-8 の世界では「あA」の文字長は 2 だし、バイト数は 4 (あ=0xE38182、a=0x41) である。 EUC-JP や Shift-JIS の時代なら、単純に「あA」は 3 バイトなので「半角 3 つ分」とすぐ分かったのだけども… (逆に文字長を調べるのが面倒だった)。はて、どうするか？　というのがこの記事でいいたいこと。 East Asian Width を見よいろいろとググ
ishisaka 2014/03/14
ねぇねぇ。サロゲートペアは？IVSは？

I18N
リンク
- 2014年3月15日
- 2014年3月14日
- 2014年3月13日