[B! ucs][utf-8] kaz_hiramatsuのブックマーク

kaz_hiramatsu id:kaz_hiramatsu

ucsとutf-8に関するkaz_hiramatsuのブックマーク (1)

UCS と Unicode
UCS ( Universal Multiple-Octet Coded Character Set ) は全ての言語の文字を一つの ( 統一された ) コードに割り当てるものです。コードテーブルは 0 〜 0x7FFFFFFF と、約２１億文字分有ります。１文字あたり４バイト使用するため UCS-4 とも呼ばれます。 Unicode は UCS の 0 〜 0x10FFFF ( 約 111 万文字 ) の部分をいいます。使います、と書きましたが実際は UCS と Unicode は策定しているグループが異なります。 UCS を策定しているグループが下位部分を採用したことから互換性が発生し、サブセット(部分集合)レベルでは同一とみなせるのが現状です。 UCS-4 の範囲では UCS-4 ( UTF-32 とも呼ばれます ) と UTF-8 の２種類のコーディ
kaz_hiramatsu 2008/10/02
unicode

utf-8

ucs
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx