Unicode正規化 その3 (2010.3.22 改訂) 結合文字列は様々な問題を引き起こします。本来は、問題が起こらないようにOSやソフトウェアの側が対応するべきですが、現状ではUnicodeの急進的な規格に技術がそこまで追いついていません。ですから、私たちは自分でなんとかするしかありません。 結合文字列の問題は「1文字なのに複数の文字データになっている」という仕様そのものにあります。この問題を避けるには結合文字列を1つの文字データだけにするしかありません。「結合文字列のポ」を「1つの文字データのポ」に変換するということです。 結合文字列を1つの文字データに変換する 「変換」と言うと、なにかとても難しい処理をするような印象をうけますよね。例えば、なんらかのアルゴリズムに従ってバイナリコードを加工する、みたいな感じです。しかし、結合文字列を1つの文字データにする場合、この方法は使えません