UTF-8とUnicodeの互換性

テクノロジーカテゴリーの変更を依頼記事元:

oshiete.goo.ne.jp

1 userがブックマークコメント

コメント

0

記事へのコメント0件

注目コメント
新着コメント

新着コメントはまだありません。
このエントリーにコメントしてみましょう。

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

UTF-8とUnicodeの互換性

まず「1文字が2バイト（16ビット）幅固定」というのは、UTF-16ではなくUCS-2のことです。 UCS-2はコード... まず「1文字が2バイト（16ビット）幅固定」というのは、UTF-16ではなくUCS-2のことです。 UCS-2はコードエリア0000～FFFFの65536文字分のみを表現できる、ある意味Unicodeのサブセットです。 UTF-16とは、サロゲートペアという仕組みを導入することで、UCS-2との互換を保ったまま、000000～10FFFF（D800～DFFFはサロゲートペア用のため除外）の1112064文字分を表現できるようにしたもので、正確には16/32ビット幅のマルチバイト文字コードです。今日、普通にUnicodeといえばUTF-16形式を指しますが、初期版ではUCS-2でした。 UTF-8は、確かに理論上は00000000～7FFFFFFFまで表現可能ですが、Unicodeで実際にコードエリアとして定義されているのは10FFFFまで（しかもその中身はスカスカで、エリアがこれ以上拡張

ブックマークしたユーザー

morishun09122010/12/06

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx