対象者 UnicodeやUTF-16について、よくわかってない人 -> ここから "😀".split("")で文字化けする理由がわからない人 -> ここから [..."👨👩👧"].lengthが5になる理由がわからない人 -> ここから 文字コードについてもう一度 文字コードは以下の二つで構成されています 符号化文字集合: 文字と、その文字の位置を示す一意の番号の集合 文字符号化方式: 文字に振られた番号をバイト表現にエンコードする方法 符号化文字集合 符号化文字集合は、 文字 その文字の位置を示す一意の番号 この二つの組み合わせの集合のことを指します。 例えばASCIIでは 8bit(128通り) でラテン文字や英数字を表現しています。 しかしASCIIには日本語などの非英語圏の文字が収録されていません。 そのため、日本語を収録したShift-JISやアジア圏の文字を収録した
![僕は、なぜ絵文字の長さが、直感に反するのか理解したい...!! - Qiita](https://cdn-ak-scissors.b.st-hatena.com/image/square/3dc3b05130670c9f890cbc72fefebc814b4915eb/height=288;version=1;width=512/https%3A%2F%2Fqiita-user-contents.imgix.net%2Fhttps%253A%252F%252Fcdn.qiita.com%252Fassets%252Fpublic%252Fadvent-calendar-ogp-background-7940cd1c8db80a7ec40711d90f43539e.jpg%3Fixlib%3Drb-4.0.0%26w%3D1200%26mark64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTk3MiZoPTM3OCZ0eHQ9JUU1JTgzJTk1JUUzJTgxJUFGJUUzJTgwJTgxJUUzJTgxJUFBJUUzJTgxJTlDJUU3JUI1JUI1JUU2JTk2JTg3JUU1JUFEJTk3JUUzJTgxJUFFJUU5JTk1JUI3JUUzJTgxJTk1JUUzJTgxJThDJUUzJTgwJTgxJUU3JTlCJUI0JUU2JTg0JTlGJUUzJTgxJUFCJUU1JThGJThEJUUzJTgxJTk5JUUzJTgyJThCJUUzJTgxJUFFJUUzJTgxJThCJUU3JTkwJTg2JUU4JUE3JUEzJUUzJTgxJTk3JUUzJTgxJTlGJUUzJTgxJTg0Li4uJTIxJTIxJnR4dC1hbGlnbj1sZWZ0JTJDdG9wJnR4dC1jb2xvcj0lMjMzQTNDM0MmdHh0LWZvbnQ9SGlyYWdpbm8lMjBTYW5zJTIwVzYmdHh0LXNpemU9NTYmcz1jOTIxNTE0Y2E1NmZlMjNmNTVhMDcwZmVkMzMwNWYwMA%26mark-x%3D120%26mark-y%3D96%26blend64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZoPTc2Jnc9OTcyJnR4dD0lNDBuZWdpYW5kbGVlayZ0eHQtY29sb3I9JTIzM0EzQzNDJnR4dC1mb250PUhpcmFnaW5vJTIwU2FucyUyMFc2JnR4dC1zaXplPTM2JnR4dC1hbGlnbj1sZWZ0JTJDdG9wJnM9MGFiYzE0MWNhZWViN2NhZWU4M2U2YThhYjJjNWY5M2U%26blend-x%3D120%26blend-y%3D500%26blend-mode%3Dnormal%26s%3Db988593e8ae90924c478e174fe92e560)