最近ではUTF-8でソースコードを書いてUTF-8で出入力をする。それ以外のエンコーディングは使われていない。…だと?誰がそんなこと言ったんだ ASCIIと古いUnicodeと新しいUnicode 少し長くなるが文字コードの話から始まる。ASCIIはお馴染み最低7bitあればASCIIの定義する文字集合を表せる。 古いUnicodeは16bitで全ての文字を表わすことを目標に作られた。 新しいUnicodeは文字(主に漢字)が多過ぎて16bitでは表せなかったので21bitに拡張された。 文字コードとエンコーディング 文字コードをどういう形式で表すかがエンコーディングだ。文字コードが7bit、16bit、21bitだからといってそのままのサイズで表わす訳ではない。ASCIIは普通8bitの型で表わすし21bitの型を用意するよりは32bitの型に格納した方が扱い易そうだ。あるいは8bit型
![誰がUTF-32が使われてないなんて言ったんだ | κeenのHappy Hacκing Blog](https://cdn-ak-scissors.b.st-hatena.com/image/square/c9d020c2a71f3e48be222b8adebc53e8f90b7020/height=288;version=1;width=512/https%3A%2F%2Fkeens.github.io%2Fimages%2Fogp%2Fpost%2FdaregaUTF-32gatsukawaretenainanteitsuttanda.png)