数字しか認識できないコンピュータが文字を扱うために、人間の文字に対応してそれぞれ割り振られた番号のこと。 つまりコンピュータは、文字コードを使って我々の文字を数字に変換してから認識をしている。 よく聞くUnicodeとは Unicodeは「符号化文字集合」と言われ、世界中の文字に対して、番号が割り当てられ管理されている集合体のこと。 ここで割り振られている番号のことをコードポイントと言います。コードポイントは符号位置(文字集合内の文字の位置)であって、符号化方式ではありません。コードポイントは16進数表示で頭にU+を付けて用いられる。 pythonでは以下のようにコードポイントを取得できます。 (python3はユニコード文字列なので、uを付けなくてOK) >>> ord("あ") 12354 >>> hex(ord("あ"))#16進数表記 '0x3042' >>> chr(12354)