"hoge".bytesize #=> 4 "hoge".encode("utf-16le").bytesize #=> 8 "shuffle".encode("utf-16le").bytesize #=> 14 "shuffle".encode("utf-16le").bytesize #=> 10 "𩸽".encode("utf-16le").bytesize #=> 4 "shuffle" は、ffl (U+fb04) という ユニコードキャラクタを含んでいる。 "𩸽" は、いわゆるサロゲートペア文字。ほっけ。Java の char や Windows の wchar_t だと 二個になる。 コードポイント数 コードポイントの数を数えるともうちょっと文字数らしくなる。 String#size または String#length を使う。 "hoge".size #=> 4 "hoge".e
![Ruby で文字数を数える - Qiita](https://cdn-ak-scissors.b.st-hatena.com/image/square/6d88c50f08ff0af998cd8cc4294396551d2ebc6c/height=288;version=1;width=512/https%3A%2F%2Fqiita-user-contents.imgix.net%2Fhttps%253A%252F%252Fcdn.qiita.com%252Fassets%252Fpublic%252Farticle-ogp-background-9f5428127621718a910c8b63951390ad.png%3Fixlib%3Drb-4.0.0%26w%3D1200%26mark64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTkxNiZoPTMzNiZ0eHQ9UnVieSUyMCVFMyU4MSVBNyVFNiU5NiU4NyVFNSVBRCU5NyVFNiU5NSVCMCVFMyU4MiU5MiVFNiU5NSVCMCVFMyU4MSU4OCVFMyU4MiU4QiZ0eHQtY29sb3I9JTIzMjEyMTIxJnR4dC1mb250PUhpcmFnaW5vJTIwU2FucyUyMFc2JnR4dC1zaXplPTU2JnR4dC1jbGlwPWVsbGlwc2lzJnR4dC1hbGlnbj1sZWZ0JTJDdG9wJnM9NTgwZDhjOTk3OWNiMGVjZDhhZjkxNThjNDI0ZGJjZDg%26mark-x%3D142%26mark-y%3D112%26blend64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTcxNiZ0eHQ9JTQwTmFiZXRhbmkmdHh0LWNvbG9yPSUyMzIxMjEyMSZ0eHQtZm9udD1IaXJhZ2lubyUyMFNhbnMlMjBXNiZ0eHQtc2l6ZT0zMiZ0eHQtYWxpZ249bGVmdCUyQ3RvcCZzPTBkYjUwMWJiZTU2ZTAxOGQyYjFjZGJkNjk2YWRkMjQw%26blend-x%3D142%26blend-y%3D491%26blend-mode%3Dnormal%26s%3D36ce3cbafb03059fe9757ec4a40d4b83)