タグ

charsetに関するtetsukampのブックマーク (2)

  • MySQL と寿司ビール問題 - かみぽわーる

    MySQL と Unicode Collation Algorithm (UCA) - かみぽわーる に関連するトピックで、 MySQL には寿司ビール問題というのがある。 寿司ビール問題どっかで詳しくお話を聞くべきだよなぁ。。。— RKajiyama (@RKajiyama) March 18, 2015 これはどういう問題かというと、 MySQL の Unicode では binary collation にしてコードポイントで比較しないと🍣と🍺に限らず絵文字が同値判定されるという問題です。 あれ? MySQL の utf8mb4 charset って、4バイト文字同士を比較すると同じ文字扱いされる? SELECT '🍣'='🍺' → 1 MySQL的には寿司とビールは同じ扱い。— とみたまさひろ (@tmtms) December 22, 2014 MySQLで select

    MySQL と寿司ビール問題 - かみぽわーる
  • 機種依存文字チェッカー

    下の枠の中に、テキストを記入してチェックボタンを押して下さい。 機種依存文字(環境によって文字化けしてしまう文字)が入っていると赤く表示されます。 機種依存文字とは その名の通り、各機種(MacPC/AT、PC-98やUNIXなど)に依存し、互換性のない文字のことです。 機種依存文字は、新JIS規格(JIS X 020)に規定されていないため、特定の環境でしか正常に表示されません。仮に、他の環境で表示させた場合、文字化けを起こして読めなくなります。また、来の機種依存文字には含みませんが、古いPC-98シリーズで使えない文字や、特にインターネット上で誤動作を誘発する半角カナといったものもあります。

  • 1