[B! Unicode][Character-code] hamastaのブックマーク

hamasta id:hamasta

UnicodeとCharacter-codeに関するhamastaのブックマーク (2)

エンコーディング表記法メモ(Hishidama's Encoding Memo)
備忘 ASCII：American Standard Code for Information Interchange [2006-07-24] UTF：UCS/Unicode Transf ormation Format [2007-05-03] Windows-31J（MS932）は機種依存文字（「①」等）を含むが、Shift_JISは含まない。[2006-07-24] →Javaでの出力例 [2007-02-13] UnicodeとUTFの関係 Unicodeは、21ビットで1文字を表す文字コード体系。[2007-05-03] （Unicodeは、地球上の全世界の文字を1つの体系で表そうと試みているらしい。当初は16ビットとしていたが、足りなくなったので21ビットになったそうだ。16ビットを超える分は補助文字と呼ぶ）プログラミング言語の中では、文字列はUnicodeの配列で表せばよい
hamasta 2006/12/02
Unicode

Character-code
リンク
JIS, EUC, SJIS の漢字コードについて
back 3つの漢字コード現在、コンピュータ上で日本語テキストを表現するのに用いられている漢字コードはおもに 3種類ある (昔は区点コードというコード体系もあったが、今ではすたれてしまった)。その 3種類は次のようなものである。なお、最初に「0x」がつく文字列は、それが 16進数 (Hexadecimal) 表記であることを表す。 JIS漢字コード ASCII コード 0x21 〜 0x7E の文字 2つを組み合わせて 1つの漢字を表現する。制御文字 (文字コード 0x1F 以下の文字) と共有できる、7bit 転送でも表現できるなどの利点があるものの、漢字と通常の ASCII コード文字 (single-byte のアルファベット) が共存できない。このために「漢字 IN」と「漢字 OUT」という 2つの制御シーケンス (制御文字列) が導入されている。漢字 IN …
hamasta 2006/05/06
Unicode

Character-code
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx