タグ

ブックマーク / qiita.com/masakielastic (1)

  • UTF-8 の4バイト文字を HTML 数値文字参照に変換する - Qiita

    対象とする読者層 この記事は何らかの理由で MySQL 5.5 で導入された utf8mb4 を使えないもしくは古い CMS のために utf8mb3 を使い続ける必要がある人を対象とします。 2019年の状況 WordPress.org の統計によれば WordPress が導入されているサーバーの9割で MySQL 5.5 以上が動いています。 問題と対策 MySQL の utf8mb3 (utf8) の仕様では、4バイト文字 (U+10000 から U+10FFFF) をそのまま保存することができないので、サロゲートペア (U+D800 から U+DFFF) に対応する2組の3バイトの文字に変換するか、HTML 数値文字参照など復号可能なデータ形式に変換する必要があります。前者についてはこちらの記事をご参照ください。 HTML 数値文字参照を選ぶメリットは標準関数で変換できることやブ

    UTF-8 の4バイト文字を HTML 数値文字参照に変換する - Qiita
    ryuzee
    ryuzee 2015/08/28
  • 1