タグ

2008年2月12日のブックマーク (3件)

  • Hey! Java Programming! //Japanese//

    このページでは日語の漢字コードについてのものです。Java では UNICODE が使用されていますが、ここでは Shift-JIS・JIS・EUC 焦点を当て、それぞれの特徴と変換方法などを解説しようと思います。 日語の種類 元々コンピュータというのは英語を使用する欧米用に設計されたものです。もちろん初期のコンピュータでは日語なんて扱うことができませんでした。欧米で使用される言葉は英語でもフランス語でも少ない文字 (アルファベットなど) を組み合わせて単語を構成します。したがってコンピュータ用に設計された文字規格も、とても少ない種類しか扱うことができません。 日語や中国語のような表意文字はとてもたくさんの種類があります。高々 1バイト (0~255) までではすべての漢字を表すことができません。日語や中国語のような表意文字を使う言語圏では、一つの文字を表すのに 2バイト使用しま

    tegetegetege
    tegetegetege 2008/02/12
    16進でみたときのコード別の例やプログラムによるコードの判定方法など
  • Unicode対応 JIS X 0208 文字コード表

    Unicode対応 JIS X 0208 文字コード一覧 JIS X 0208 の区点番号、JISコード、シフトJISコード、EUCコード、Unicode(UTF-8, UTF-16)の文字コード対応一覧です。 文字コードとその文字を順に出力しているだけですので、表示される文字はフォントによって決まります。 01区~08区 JIS非漢字(各種記号、英数字、かな) 13区~13区 NEC特殊文字(機種依存) 16区~47区 JIS第1水準漢字 48区~84区 JIS第2水準漢字 文字コードについてのページや、文字コード一覧についての説明もあります。 JIS X 0208 JIS非漢字 文字コード表 区 点 JIS SJIS EUC UTF-8 UTF-16 字 01 01 2121 8140 A1A1 E38080 3000 01 02 2122 8141 A1A2 E38081 3001

    tegetegetege
    tegetegetege 2008/02/12
    Unicode対応のJIS第一水準漢字の文字コード表
  • ISO-8859-1の拡張ascii文字 » Supper's Ready

    覚え書きっつーか、よそに掲載されていたテーブルなんだけど、残ってるのはキャッシュだけで、家は消えてしまっていたので仕方なく、そのままコピって貼り付けておくことにする。ちなみに実体参照の欄の&は、全角になっている。なぜなら半角にすると、WordPressが勝手に文字に変換してしまうからorz いらねえことすんなよ、まったくもう… ISO-8859-1の拡張ascii文字 文字 16進数での表現 10進数 文字実体参照 意味

    tegetegetege
    tegetegetege 2008/02/12
    ISO-8859-1の拡張ascii文字一覧。16進表記あり