[B! Unicode] dogatanaのブックマーク

dogatana id:dogatana

Unicodeに関するdogatanaのブックマーク (3)

Unicode 15.1 Character Code Charts
European Scripts Armenian Armenian Ligatures Carian Caucasian Albanian Cypriot Syllabary Cypro-Minoan Cyrillic Cyrillic Supplement Cyrillic Extended-A Cyrillic Extended-B Cyrillic Extended-C Cyrillic Extended-D Elbasan Georgian Georgian Extended Georgian Supplement Glagolitic Glagolitic Supplement Gothic Greek Greek Extended Ancient Greek Numbers Latin Basic Latin (ASCII) Latin-1 Supplement Latin
dogatana 2017/02/14
Unicode
リンク
基本多言語面 ‐ 通信用語の基礎知識
この面の符号位置は、全ての面のうちで最も若い番号に割り当てられている。可変長を取る符号化の場合、他の面より短い符号列で表現される。 UTF-8 ‐ 3オクテット以下 UTF-16 ‐ 2オクテット UTF-32 ‐ 4オクテット UTF-32は面を問わず常に4オクテットである。 UTF-16は2オクテット単位の可変長だが、BMPを表現する場合にはサロゲートペアを使わないため、常に2オクテットとなる。これは、古典的なUnicode仕様と互換性がある。 UTF-8は、従来のASCII相当が1オクテット、U+07FF以下の文字が2オクテットで、それ以外は全て3オクテットである。文字には番号が振られて領域に配置される。これら文字は、当初より種類ごとに分類されているが、途中の仕様変更や拡張に伴い、枠組みは殆ど意味を成さなくなっている。 BMPは当初、次の4領域に分けられていた。Unicode関係の
dogatana 2017/02/01
Unicode
リンク
日本の文字とUnicode　第1回 | 大修館書店　WEB国語教室
現代において、文字を書くということは、コンピュータやケータイのキーを打つことと、ほぼ同義になってきています。そして、現代のコンピュータにおいて文字を扱うためには、文字コード、それもUnicodeの助けを借りるしかなくなってきています。でも、Unicodeは日本語に特化して作られたわけではないので、日本の文字を扱おうとした場合、色々とヤヤコシイ点があったりします。それらのヤヤコシイ点を、できるだけ平易に説明するこのシリーズ、最初はASCII・Latin1とUnicodeの関係です。 Unicodeの最初の128文字(U+0000～U+007F、コード表参照)には、ASCIIという文字コードがそのまま収録されています。Unicodeは元々アメリカ生まれなので、アメリカでの標準的な文字コードであるASCII (American Standard Code for Information Inte
dogatana 2016/10/23
Unicode

文字コード
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx