インターネット上で日本語を扱う際には、現在、3種類の文字コードが使われています。いずれも1文字を2バイトで表しますが、1バイトを 7 bit で表すものと、8 bit で表すものとがあります。 実はこれ、『文字符号化方式』であって、元になる『符号化文字集合』にはいずれも別途に JIS で決めた文字の集まり(JIS X 0208) + 独自拡張を使っていたりするんで、この際区別しときましょうか。 符号化文字集合 「コンピュータではこの字を使う」と決めた、表のような字引のような存在。それぞれの字を実際にどのように表現するかは、また別の問題。 JIS X 0201 まだコンピュータに漢字が使えなかった頃から存在する、アルファベットとカタカナだけが収録された規格。いわゆる『半角カナ文字』を収めたもの。 JIS X 0208 今日なお漢字を書くのに使われている規格。何度か改訂されているので、版によっ