エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
Javaで、文字列を一文字ずつに分解する (サロゲートペアや結合文字を考慮)
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
Javaで、文字列を一文字ずつに分解する (サロゲートペアや結合文字を考慮)
まとめ Javaの標準APIで実現できる。 java.text.BreakIterator.getCharacterInstance() を使用すればよ... まとめ Javaの標準APIで実現できる。 java.text.BreakIterator.getCharacterInstance() を使用すればよい。 なお、以下の文章における「文字」という語は、「書記素クラスター」(grapheme clusters) を意味している。 要件 Javaの文字列 (UTF-16) を、「一文字ずつ」に分解(分割)したい。 ただし、String#toCharArray() は使用できない。 理由: UTF-16 で扱う文字の中には、単一の char (16ビット) に収まらない文字が存在するため。もし String#toCharArray() を使用してしまうと、一つの文字が 複数の char値 に分断されてしまう。 たとえば、U+20BB7 (𠮷) は一文字だが、格納するためには char型の変数が2つ必要。 char[] u_20bb7_tsuc