Unicode to CP932のテーブルをtwitterで教えてもらった*1。このテーブルで目を引くのは、Latin-1 Supplementブロックに限って、数多くのフォールバックが定義されていること。で、この部分を図にしてみた(フォントはMSゴシック)。 2つずつ横に並べた文字のうち、左がオリジナルのUnicodeテキストで、右がそれをCP932に変換したもの。CP932の欄の白地は通常のマッピング、グレー地はマッピングなし、黄色地がフォルーバック。「Þ→T」や「ß→s」のような大胆な例も含まれる*2。 フォールバックは、ゲタよりはマシかもしれない。しかし、たとえばOutlookやWinMailは、「ß」を警告もなしに「s」に変換して送信してしまう。それしか手段がないならともかく、UTF-8で送れば問題ないのに。というわけで、このフォールバック・テーブルの存在は、一応心に留めておいた
![Unicode to CP932のフォールバック・マッピング - 帰ってきた💫Unicode刑事〔デカ〕リターンズ](https://cdn-ak-scissors.b.st-hatena.com/image/square/206d5828d038c0747fa3e14b293cde69c1d8f7fc/height=288;version=1;width=512/https%3A%2F%2Fcdn-ak.f.st-hatena.com%2Fimages%2Ffotolife%2FN%2FNAOI%2F20100812%2F20100812194502.png)