タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

UnicodeとCharacter-codeに関するhamastaのブックマーク (2)

  • エンコーディング表記法メモ(Hishidama's Encoding Memo)

    備忘 ASCII:American Standard Code for Information Interchange [2006-07-24] UTF:UCS/Unicode Transformation Format [2007-05-03] Windows-31J(MS932)は機種依存文字(「①」等)を含むが、Shift_JISは含まない。[2006-07-24] →Javaでの出力例 [2007-02-13] UnicodeとUTFの関係 Unicodeは、21ビットで1文字を表す文字コード体系。[2007-05-03] (Unicodeは、地球上の全世界の文字を1つの体系で表そうと試みているらしい。当初は16ビットとしていたが、足りなくなったので21ビットになったそうだ。16ビットを超える分は補助文字と呼ぶ) プログラミング言語の中では、文字列はUnicodeの配列で表せばよい

  • JIS, EUC, SJIS の漢字コードについて

    back 3つの 漢字コード 現在、コンピュータ上で日語テキストを表現するのに用いられている 漢字コードはおもに 3種類ある (昔は区点コードというコード体系も あったが、今ではすたれてしまった)。その 3種類は次のようなものである。 なお、最初に「0x」がつく文字列は、それが 16進数 (Hexadecimal) 表記であることを表す。 JIS漢字コード ASCII コード 0x21 〜 0x7E の文字 2つを組み合わせて 1つの 漢字を表現する。制御文字 (文字コード 0x1F 以下の文字) と共有できる、7bit 転送でも表現できる などの利点があるものの、漢字と通常の ASCII コード文字 (single-byte のアルファベット) が 共存できない。このために「漢字 IN」と「漢字 OUT」という 2つの 制御シーケンス (制御文字列) が導入されている。 漢字 IN …

  • 1