もう文字コードはおなかいっぱいなのですが... Unicode と UTF の違い Unicode : 符号化文字集合 UTF : 符号化方式 符号化文字集合と、符号化方式についてはこちらを参照 -> 本当は怖くないCP932 文字セットの切り替えなしに、世界中の文字を単一文字集合として扱う符号化文字集合規格 21ビットの範囲(0x00000〜0x10FFFF) 各文字の位置は先頭に U+ をつけて表す( Unicodeコードポイント と呼ぶ) 例えば 🗿 ならば U+1F5FF UTF-8, UTF-16, UTF-32 の違い UTF-32 Unicodeコードポイントをそのままつかった符号化方式 21ビットだと切りが悪いので、32ビット UTF-16 1文字16ビット 元々、unicodeは16ビットの固定長として開発されたため 、最初はUTF-16が、unicodeの唯一の符号化
![Unicode, UTF についてひっかかったので色々メモ - Qiita](https://cdn-ak-scissors.b.st-hatena.com/image/square/0aabc388dc551fb904d7465c735ce96613bb38f6/height=288;version=1;width=512/https%3A%2F%2Fqiita-user-contents.imgix.net%2Fhttps%253A%252F%252Fcdn.qiita.com%252Fassets%252Fpublic%252Farticle-ogp-background-9f5428127621718a910c8b63951390ad.png%3Fixlib%3Drb-4.0.0%26w%3D1200%26mark64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTkxNiZoPTMzNiZ0eHQ9VW5pY29kZSUyQyUyMFVURiUyMCVFMyU4MSVBQiVFMyU4MSVBNCVFMyU4MSU4NCVFMyU4MSVBNiVFMyU4MSVCMiVFMyU4MSVBMyVFMyU4MSU4QiVFMyU4MSU4QiVFMyU4MSVBMyVFMyU4MSU5RiVFMyU4MSVBRSVFMyU4MSVBNyVFOCU4OSVCMiVFMyU4MCU4NSVFMyU4MyVBMSVFMyU4MyVBMiZ0eHQtY29sb3I9JTIzMjEyMTIxJnR4dC1mb250PUhpcmFnaW5vJTIwU2FucyUyMFc2JnR4dC1zaXplPTU2JnR4dC1jbGlwPWVsbGlwc2lzJnR4dC1hbGlnbj1sZWZ0JTJDdG9wJnM9YTdhYTg3MzA0ZDE1OGI3ZDc5YTM4NjZjNWY3M2QwMjQ%26mark-x%3D142%26mark-y%3D112%26blend64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTYxNiZ0eHQ9JTQwa2FzZWktc2FuJnR4dC1jb2xvcj0lMjMyMTIxMjEmdHh0LWZvbnQ9SGlyYWdpbm8lMjBTYW5zJTIwVzYmdHh0LXNpemU9MzYmdHh0LWFsaWduPWxlZnQlMkN0b3Amcz00YTQ2MjhjNjA3M2IxOTQ1ZTQyMjk0Yjc5OTczMDQ1OQ%26blend-x%3D142%26blend-y%3D491%26blend-mode%3Dnormal%26s%3Dea8e94e9ff9dec8289e29ec0a810e47f)