追記。このエントリで取り上げている問題は、8月13日に修正されたようです。 iPhoneやiPadのSafariでtwitterを見ると、Unicodeの追加面(BMP外)の文字が、すべて化ける*1。キャプチャ画像は、上がLionのSafari、下がiPhoneのSafari。 化け方の理屈は、Unicodeの符号位置(Unicodeスカラ値)の5桁目が落ちてしまうというもの(下図)。 おそらく、twitterがiPhoneやiPadに最適化されたページのソースを動的に生成するスクリプトにおいて、UTF-8でもサロゲートペアがバラで符号化されているようなつもりで処理してしまっているのだと思う*2。 *1:iPadのSafariは以前は化けなかったのだが、iPad版新twitterに移行してからは化けるようになった。 *2:という結論に達するまでに、twitter経由で貴重な情報をいただきま