はじめに タイトルにある通り、文字コードについて学習したことを記載していきたいと思います。 文字コードとは 数字しか認識できないコンピュータが文字を扱うために、人間の文字に対応してそれぞれ割り振られた番号のこと。 つまりコンピュータは、文字コードを使って我々の文字を数字に変換してから認識をしている。 よく聞くUnicodeとは Unicodeは**「符号化文字集合」と言われ、世界中の文字に対して、番号が割り当てられ管理されている集合体**のこと。 ここで割り振られている番号のことをコードポイントと言います。コードポイントは符号位置(文字集合内の文字の位置)であって、符号化方式ではありません。コードポイントは16進数表示で頭にU+を付けて用いられる。 pythonでは以下のようにコードポイントを取得できます。 (python3はユニコード文字列なので、uを付けなくてOK) ここからさらに数値