タグ

2023年2月13日のブックマーク (1件)

  • Unicode

    Unicodeスカラ値 文字セットは16進数にU+をつけて U+0000~U+10FFFF で表します。これをUnicodeスカラ値といいます。 第0面は16進数で4桁で U+0000~U+FFFF と表します。この16ビット(2バイト)で表現できる部分は65536文字で、ここには基的な文字を登録してあり、基多言語面(BMP)と呼ばれます。 BMPの他に16ビット65536文字の面が16あります。0000~FFFF の前に 1,2,3,...D,E,F,10 と 16進数で 1から16 の番号がついていると考えれば理解できると思います。 UTF-16 エンコード JISで面区点で示された文字を実際に使うときに、ISO-2022-JP,Shift_JIS,EUC-JPなどさまざまなエンコーディングを使用したのと同様に、Unicodeにもたくさんの方式があります。主に使われているのは UT