rikuoのブックマーク - はてなブックマーク

rikuo id:rikuo

ブックマーク / takenspc.hatenadiary.org (1)

東アジアの文字幅 (East Asian Width) の判定 - 中途
Unicodeの文字が全角で表示されるか半角で表示されるかは東アジアの文字幅特性値がヒントを与えてくれるそうです。（日本語の場合は）この値がNa（狭）、N（中立）、H（半角）だと半角、W（広）、F（全角）、A（曖昧）だと全角として扱うことが推奨されているようです。 Pythonではunicodedataモジュールを使うとこの特性値を取得できますが、JavaScriptにはそのような関数は見当たりません。ですが、Unicode Consortiumが、どの文字がどの東アジアの文字幅を持つかのデータファイルを公開しているので、そこから判定用のコードを機械的に生成できるはずです。で、以下が実際に生成したコードです。データファイルに、データファイルに出現しない文字はNとなるとあるので、以下ではN以外（F、H、W、Na、A）についてのみチェックを行い、それ以外をNと判定するようにしています。コメ
rikuo 2011/11/28
javascript

unicode
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx