タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

javaとJavaとunicodeに関するcrafのブックマーク (3)

  • JIS2004に含まれるサロゲートペア。Javaでの文字列操作を検証してみた | 株式会社メイプルシステムズ

    最近のマイブームは、映画「アナと雪の女王」関連の色んな動画を子供と一緒に見ることです。でも映画自体はなかなか観に行けずにいます。おにです。 ここのところ、タイトルにある「サロゲートペア(4バイトで1文字を表す文字)」に関わる時間が多く、油断すると錯覚(幻覚?)で「アナと雪の女王」の文字もサロゲートペアに見えて来そうです。(まだ老眼にはなってません。) 今回はその「サロゲートペア」が含まれた文字列のJavaでの文字列操作について試してみたいと思います。 サロゲートペアってなに? サロゲートペアは、上位サロゲートと下位サロゲートを組み合わせて1文字を表現する4バイトのUnicode文字です。Windows Vista(JIS2004)で追加された文字にサロゲートペアは304文字存在します。 Windows XPでは表示できなかった文字なのであまり馴染みはありませんが、Windows XPのサポ

    JIS2004に含まれるサロゲートペア。Javaでの文字列操作を検証してみた | 株式会社メイプルシステムズ
  • まさゆき's 日記

    月曜日 9月 24, 2007 サロゲート ペアを含んだ XML の読み書き サロゲート ペアを含んでいる場合、UTF-16 で XML ファイルを読み書きすれば、ほとんど問題ないが、UTF-8 の場合 Modified UTF-8 の存在によってちょっと気をつける必要がある。 たとえば、次のようなコードはこの問題にぶち当たる。 public class SurrogatePairTest { private static final String SURROGATE_PAIR_ELEMENT = "surrogate-pair"; private static final String SURROGATE_PAIR = "\ud842\udf9f"; private static final File SURROGATE_PAIR_FILE = new File("SurrogatePa

  • IBM Developer

    IBM Developer is your one-stop location for getting hands-on training and learning in-demand skills on relevant technologies such as generative AI, data science, AI, and open source.

    IBM Developer
  • 1