SafariからEUC-JPのページ(はてなダイアリーやmixiなど)に、「鷗」と書き込むと「鴎」に化けたりする。似たような文字化けには、Unicode正規化によるもの(MailやSafariで互換漢字が化ける)やWindows外字に関するもの(EUC-JPのページにおけるWindows外字がめんどくさいことになっている件)などがあるが、ややこしいことに、この例はそのどちらでもない。 原因は、Safariの採用しているEUC-JP用の変換テーブル(IBM-33722)のフォールバック。下図は、UnicodeをEUC-JPに変換する際の、IBM-33722における漢字のフォールバックをまとめたもの*1。単に「EUC-JPにない文字」であれば、EUC-JPのページへは数値文字参照で送信されるので化けることはないのだが、フォールバックが定義されているために字体が変わってしまう。 ところで、素朴な