2015年2月11日のブックマーク (1件)

  • JIS2004に含まれるサロゲートペア。Javaでの文字列操作を検証してみた | 株式会社メイプルシステムズ

    最近のマイブームは、映画「アナと雪の女王」関連の色んな動画を子供と一緒に見ることです。でも映画自体はなかなか観に行けずにいます。おにです。 ここのところ、タイトルにある「サロゲートペア(4バイトで1文字を表す文字)」に関わる時間が多く、油断すると錯覚(幻覚?)で「アナと雪の女王」の文字もサロゲートペアに見えて来そうです。(まだ老眼にはなってません。) 今回はその「サロゲートペア」が含まれた文字列のJavaでの文字列操作について試してみたいと思います。 サロゲートペアってなに? サロゲートペアは、上位サロゲートと下位サロゲートを組み合わせて1文字を表現する4バイトのUnicode文字です。Windows Vista(JIS2004)で追加された文字にサロゲートペアは304文字存在します。 Windows XPでは表示できなかった文字なのであまり馴染みはありませんが、Windows XPのサポ

    JIS2004に含まれるサロゲートペア。Javaでの文字列操作を検証してみた | 株式会社メイプルシステムズ