日本語の文書データをコンピュータで処理するために、 JIS で定められた文字コード (JIS X 0208) です。 n 桁の 2 進数 は 2n の情報を表すことができますから、 7 桁なら 27 = 128 種類というわけで、 ASCII は 7 ビットで 128 種類の文字や記号、制御文字などを定めています。 アルファベットは大文字小文字あわせて 52 種類、 それに数字や記号を加えて 94 種類、 さらに様々の制御文字を加えても、 128 あれば事足りるからです。 しかし日本語は、 そうはいきません。 なにしろ漢字が、 途方もなくあります。 1 万とも、 2 万とも、 5 万とも。 常用漢字に限っても 1,945 文字ですから、 これを扱うのに必要なビット数を 情報量電卓 で計算すると、 10.93 ビットになります。 1 万文字なら 13.3 ビット、 2 万文字なら 14.3