エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
EUC-JPのページにおけるWindows外字がめんどくさいことになっている件 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
EUC-JPのページにおけるWindows外字がめんどくさいことになっている件 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
EUC-JPのページにおけるWindows外字の扱いが、ややこしいことになっている。まあ、もともと外字なので化... EUC-JPのページにおけるWindows外字の扱いが、ややこしいことになっている。まあ、もともと外字なので化けることがあるのは当然とも言えるのだけれど、化け方のバリエーションが豊富で、どういう理屈で化けているのかがわかりにくい。以下、はてなとmixiで目に付いた文字化けについて、ざっとまとめてみようと思う。 はてなダイアリーの詳細編集画面で、FirefoxまたはChromeから「﨑」という字を入力して「確認する」ボタンを押すと、「粼」に化ける(下図)。 これは、はてなのサーバがCP51932のNEC選定IBM拡張文字領域をJIS X 0213と見なした上で補助漢字に変換しているためだが、へんな仕様だと思う(下図)。たぶんPerlのEncodeモジュールでEUC-JPをUnicodeに変換した上でEUC-JPに戻しているのだろう*1。 mixiの日記でMac OS XのSafariから「﨑