はじめに JavaScript において文字数を String の length で取得すると、期待した値が得られないことがある。この記事では、実際に String の length を使うことによって発生した Prettier のバグを紹介する。 前提 JavaScript の String には length というプロパティが存在する。このlengthプロパティは文字列の文字数を表すものではない。 実際には、文字列中に含まれるUTF-16のコードユニットの数を返す。つまり、ASCIIをはじめとしたBMPに含まれるものであれば我々の期待する文字数が返ってくるが、一部の漢字やemojiなどについてはそうはならない。 たとえば、漢字の𠮟(U+20B9F)はサロゲートペアであり、2つのコードユニットで表される。そのため、length は 2 になる。
![JavaScript で文字数を length で数えるのはやめようの実例](https://cdn-ak-scissors.b.st-hatena.com/image/square/152bf1b26169cf19d809878bd2865dcab85a91bb/height=288;version=1;width=512/https%3A%2F%2Fres.cloudinary.com%2Fzenn%2Fimage%2Fupload%2Fs--J7-L5uBc--%2Fc_fit%252Cg_north_west%252Cl_text%3Anotosansjp-medium.otf_55%3AJavaScript%252520%2525E3%252581%2525A7%2525E6%252596%252587%2525E5%2525AD%252597%2525E6%252595%2525B0%2525E3%252582%252592%252520length%252520%2525E3%252581%2525A7%2525E6%252595%2525B0%2525E3%252581%252588%2525E3%252582%25258B%2525E3%252581%2525AE%2525E3%252581%2525AF%2525E3%252582%252584%2525E3%252582%252581%2525E3%252582%252588%2525E3%252581%252586%2525E3%252581%2525AE%2525E5%2525AE%25259F%2525E4%2525BE%25258B%252Cw_1010%252Cx_90%252Cy_100%2Fg_south_west%252Cl_text%3Anotosansjp-medium.otf_37%3ASosuke%252520Suzuki%252Cx_203%252Cy_121%2Fg_south_west%252Ch_90%252Cl_fetch%3AaHR0cHM6Ly9saDMuZ29vZ2xldXNlcmNvbnRlbnQuY29tL2EtL0FPaDE0R2kzVm5WZHo2MC1CT3lMTS1VVnZaNmdNSDJlTlp1T0lTa1owT3lyNnc9czI1MC1j%252Cr_max%252Cw_90%252Cx_87%252Cy_95%2Fv1627283836%2Fdefault%2Fog-base-w1200-v2.png)