タグ

SJISに関するtekimenのブックマーク (2)

  • mbstring/libmbfl モバイル用UTF-8 - Opensource days

    Unicode 6.0 <-> モバイル用UTF-8の相互変換を可能としました。実際のコードをテストするには、github.com のlibmbfl のレポジトリか、svn.php.netからPHP 5.4または5.5の開発用ソースコードを取得ください。 以下、仕様等について記述します。 UTF-8-Mobileの必要性 UTF-8に関しては、現状でキャリア毎に異なるマッピングでPUA領域に絵文字が設定されています。 また、Unicode数値エンティティについてもPUA領域にマップされることが前提の仕様となっています。 前稿で、Shift_JISからUnicode PUAへのマッピングをレガシー(現状?)サポートとして作成しましたが、Unicode 6.0をベースにしたシンプルな実装を目標とすると、Shift_JISからUnicodeへのマップが2通りある(Unicode PUAとUnic

    mbstring/libmbfl モバイル用UTF-8 - Opensource days
  • UTF-8からSJISに文字化けすると糸偏の漢字がよく出てくる - Qiita

    はじめに Twitterで、文字化けネタを幾つかつぶやきました。 サッちゃんはね サチコっていうんだ ほんとはね だけど ちっちゃいから 自分のこと SJISで 保存するんだよ おかしいな 繧オ繝ちゃん — ロボ太 (@kaityo256) 2017年10月10日 「私 魔女のキキです。こっちはSJISの繧ク繧ク」 — ロボ太 (@kaityo256) 2018年1月6日 UTF-8「もしかして…」 SJIS「私達…」 「「入れ替わ縺縺ヲ繧九≦縲懶シ†」」 — ロボ太 (@kaityo256) 2018年2月13日 どれもUTF-8で保存された文字をSJISとして解釈したための文字化けを表現したものですが、パッと見で「糸偏の漢字が多いな」ということがわかるかと思います。なぜそうなるかを簡単に説明してみようと思います。 なお、文字コードはいろいろ面倒なので、ここではざっくりとしたことしか言い

    UTF-8からSJISに文字化けすると糸偏の漢字がよく出てくる - Qiita
    tekimen
    tekimen 2018/02/21
    “繧繝(うん-げん)は、同系色の濃淡による色のぼかしのことで、 そういう染め方や、織物を、繧繝染めとか、繧繝錦、とか言います。”勉強になりました。
  • 1