タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

Unicodeに関するdogatanaのブックマーク (3)

  • Unicode 15.1 Character Code Charts

    European Scripts Armenian Armenian Ligatures Carian Caucasian Albanian Cypriot Syllabary Cypro-Minoan Cyrillic Cyrillic Supplement Cyrillic Extended-A Cyrillic Extended-B Cyrillic Extended-C Cyrillic Extended-D Elbasan Georgian Georgian Extended Georgian Supplement Glagolitic Glagolitic Supplement Gothic Greek Greek Extended Ancient Greek Numbers Latin Basic Latin (ASCII) Latin-1 Supplement Latin

  • 基本多言語面 ‐ 通信用語の基礎知識

    この面の符号位置は、全ての面のうちで最も若い番号に割り当てられている。可変長を取る符号化の場合、他の面より短い符号列で表現される。 UTF-8 ‐ 3オクテット以下 UTF-16 ‐ 2オクテット UTF-32 ‐ 4オクテット UTF-32は面を問わず常に4オクテットである。 UTF-16は2オクテット単位の可変長だが、BMPを表現する場合にはサロゲートペアを使わないため、常に2オクテットとなる。これは、古典的なUnicode仕様と互換性がある。 UTF-8は、従来のASCII相当が1オクテット、U+07FF以下の文字が2オクテットで、それ以外は全て3オクテットである。 文字には番号が振られて領域に配置される。これら文字は、当初より種類ごとに分類されているが、途中の仕様変更や拡張に伴い、枠組みは殆ど意味を成さなくなっている。 BMPは当初、次の4領域に分けられていた。Unicode関係の

  • 日本の文字とUnicode 第1回 | 大修館書店 WEB国語教室

    現代において、文字を書くということは、コンピュータやケータイのキーを打つことと、ほぼ同義になってきています。そして、現代のコンピュータにおいて文字を扱うためには、文字コード、それもUnicodeの助けを借りるしかなくなってきています。でも、Unicodeは日語に特化して作られたわけではないので、日の文字を扱おうとした場合、色々とヤヤコシイ点があったりします。それらのヤヤコシイ点を、できるだけ平易に説明するこのシリーズ、最初はASCII・Latin1とUnicodeの関係です。 Unicodeの最初の128文字(U+0000~U+007F、コード表参照)には、ASCIIという文字コードがそのまま収録されています。Unicodeは元々アメリカ生まれなので、アメリカでの標準的な文字コードであるASCII (American Standard Code for Information Inte

  • 1