個人的にC言語でUnicodeを扱う機会があったので調べた。体系的に説明している記事が見当たらないのでまとめておく。 Unicode とは WikipediaのUnicodeから引用する。 Unicode は世界で使われる全ての文字を共通の文字集合にて利用できるようにしようという考えで作られ、Unix、Windows、Mac OS X、Plan 9[2]、Javaなどで利用されている。 文字コードと文字集合と文字エンコーディング 「文字コード」と「文字集合」と「文字エンコーディング」は異なる概念である。混同していると検索の際に適切な情報に辿りつけない。逆に、この区別がわかっていればコードを書く際に悩むことはない。私は最初、自分で混同していたことにすら気付かなかった。 「文字集合」とは、その名の通り文字の集合だ。アルファベットやカタカナ、漢字などを含む。具体的には、各文字(図形)に対して番号