タグ

ブックマーク / moji-memo.hatenablog.jp (10)

  • iPhone間の新しい文字化け「兄化け」 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    iPhone間の新しい文字化けパターンが発見されたのでメモ*1。この少なくとも3つのダメな仕様が重なって発生する文字化けは、発見者によって「兄化け」と命名された*2。 「兄化け」は、兄がSoftBankまたはauのiPhoneでメッセージアプリを、妹がiPhoneのメールアプリでdocomo.ne.jpアドレスを使っている場合に発生する。兄が絵文字入りのメールを送信すると、妹の環境では絵文字が豆腐に化け、それを引用して返信すると、今度は兄の側でメッセージ全文が化ける。 以下、この文字化けの理屈について。兄のメッセージアプリは、絵文字入りのメッセージをUTF-8で送信。キャリアの送信側のサーバが、これをドコモのShift_JISに変換する。しかし、妹のiPhoneのメールアプリはドコモのShift_JISに対応していないので、ドコモの絵文字を単に「Shift_JISの未定義領域の文字」として

    iPhone間の新しい文字化け「兄化け」 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
    syuu1228
    syuu1228 2013/10/23
    めんどくさっ…:iPhone間の新しい文字化け「兄化け」 - Mac OS Xの文字コード問題に関するメモ
  • 最も危険な絵文字 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    で、昨日の続きなんだけどね。 あ、絵文字のお話でしたら間に合ってまーす。 そんな、悪徳光回線業者を門前払いするみたいな言い方しなくてもさ。今回の話は聞いておいたほうがいいのに。 ほんとですか? うん。Unicode 7.0で入る絵文字のうち、密やかに不吉な光を放っているのが、これだ。 ピースサインですか? これなら前からありませんでしたっけ? 前からあるのは、こっち。向きが違うんだよね。 はあ。で、それが何か? 向きが変わると、やばい意味になる可能性がある。 どういう意味になるんですか? 要するに中指のアレと同じようなものかな。 ……またですか。 まあ待て。アレの意味は誰にも明らかだけど、この1F594はピースサインのつもりでメールとかに使っちゃったりしそうでしょ。受け取った人が、それを見てぶち切れるかもしれない。 そんな大げさな。 言ってみれば、木の枝に擬態した毒蛇がとつぜん牙をむくよう

    最も危険な絵文字 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
    syuu1228
    syuu1228 2013/08/24
    最も危険な絵文字 - Mac OS Xの文字コード問題に関するメモ
  • Unicodeに不愉快な絵文字が - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    ちょっと先の話なんだけどさ。たぶん来年(2014年)、Unicodeに絵文字がまたどっさり入るんだよね*1。 それは楽しみですねー。どんなのが入るんですか? たとえば、こんなの*2とか……。 …………。 えーっと、他にはね……。 もういいです。 【今回の話題に関連するISO/IEC JTC1/SC2/WG2の資料】 2011-09-23 Updated proposal to add Wingdings and Webdings Symbols 2012-02-16 Disposition of comments on SC2 N 4201(PDAM text for Amendment 1.2 to ISO/IEC 10646 3rd edition) 2012-10-09 Disposition of comments on SC2 N 4228(PDAM text for Amend

    Unicodeに不愉快な絵文字が - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
    syuu1228
    syuu1228 2013/08/24
    Unicodeに不愉快な絵文字が - Mac OS Xの文字コード問題に関するメモ
  • 山ライオンMailの絵文字に関する仕様変更 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    OS X 10.7 Lion以降のMailは、ケータイのアカウント宛にケータイのエンコーディングで絵文字を送ることができる(LionのMailはケータイと絵文字のやりとりができるよ!)。OS X 10.8 Mountain Lionでは、その仕様が変更された。良くなったのか、悪くなったのか。 下図の例では、LionもMountain Lionも、ドコモのアカウント(@docomo.ne.jp)に対して、太陽の絵文字をドコモのShift_JISで送っている。iモードにはないバラの絵文字がメッセージに含まれるとき、Lionはメッセージ全体をcharset=utf-8で送信する。太陽とバラの両方がメッセージに含まれる場合、Lionでは(バラを含むために)charset=utf-8となり、iモードにある太陽の絵文字まで「・」になってしまう。一方Mountain Lionは、iモードにはないバラの絵

    山ライオンMailの絵文字に関する仕様変更 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
    syuu1228
    syuu1228 2013/08/24
    山ライオンMailの絵文字に関する仕様変更 - Mac OS Xの文字コード問題に関するメモ
  • 絵文字バリエーション・シーケンスとは何か - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    たとえば、仕事用のメールの署名に「☎」という文字を入れていたら、iPhoneではそれが絵文字の赤電話として表示されてびっくり。というような経験をしたことがある人は、たぶん少なくないと思う。こういうことが起きるのは、「絵文字じゃない文字」と「絵文字」がUnicodeでは同じ符号位置に包摂されていて、どちらが表示されるかはフォント(の優先順位)次第だからだ。 ケータイ絵文字をUnicodeに収録する際、Appleはすべての絵文字に独立した(通常の文字とは別の)符号位置を与えたかったようだが、それはかなわなかった。そこで次善の策として、「絵文字じゃない文字」と「絵文字」をプレーン・テキストで区別するメカニズムをUnicodeに提案した。それが絵文字バリエーション・シーケンス(EVS)だ*1。EVSはUnicode 6.1に入り、Mountain Lionでサポートされた。下図は、Mountain

    絵文字バリエーション・シーケンスとは何か - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
    syuu1228
    syuu1228 2013/08/24
    OSX/iOSの絵文字って文字コードでどう表現されてんだろって思ったらくっそ詳しく解説されてた:絵文字バリエーション・シーケンスとは何か - Mac OS Xの文字コード問題に関するメモ
  • アレはどこから来たの? - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    Unicodeっていうと、まあ、なんでもありなかんじもしますけど、結局、JIS規格にもなるわけですよね。*1 当然、そうなるね。 JIS規格にアレが入るんですか? うん。JIS規格にアレ。まあ、すでにあんなのの例もあるけどね。 でもそれには、ケータイ絵文字というソースがありますよね。中指のアレのほうはどこから来たんですか? うーん、ちょっと長くなるけど、アレを押し込んだアイルランドの理屈を大ざっぱに言うと……。まず、たとえば親指を立てたジェスチャーは、ヨーロッパやアメリカでは肯定的な意味を持つけど、これが侮辱的な振る舞いとなる文化も存在する、と。 あー、そういう話、聞いたことあるかも。 つまり、「ある文化においては侮辱的な意味を持つハンドジェスチャー」のいくつかが、すでにUnicodeに入っている、と。 はいはい。 そうである以上、「よりユニバーサルに認識されている侮辱的な意味を持つハンド

    アレはどこから来たの? - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
    syuu1228
    syuu1228 2013/01/30
    アレはどこから来たの? - Mac OS Xの文字コード問題に関するメモ
  • SoftBank iPhoneのShift_JISによる文字化け - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    前回の続き。やや細かい話になるが、SoftBank iPhoneのShift_JISによって具体的にどのような文字化けが引き起こされるかを見ていくこととする。 SoftBank iPhoneのMailは、Windows外字をcharset=Shift_JISで送信する。これを表示できるかどうかは受信側のメーラーによる*1。下図は、件名と文に「iPhoneから①」と入力したメッセージをSoftBank iPhoneのMailから送信し、LionのMailで受信した例。MacのMailは(SoftBank iPhoneのMailとは逆に)charset=Shift_JISを比較的厳密に解釈し、「①」という「Shift_JISに含まれないはずの文字」が存在することで、そのメッセージをShift_JISとしてデコードするのをやめてしまう。その結果、英数字以外のすべての文字が化けている。このような

    SoftBank iPhoneのShift_JISによる文字化け - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
    syuu1228
    syuu1228 2012/04/25
    SoftBank iPhoneのShift_JISによる文字化け - Mac OS Xの文字コード問題に関するメモ
  • Mac OS Xの文字コード問題に関するメモ

    文字情報基盤(Moji_Joho)のIVS登録にともなう公開レビュー(PRI 259)にコメントした。PDFはこちら。日語。もう、最初から最後まで日語。 安岡孝一さんが挙げていた(yasuokaの日記:文字情報基盤のIVS登録第1弾)ような「Hanyo-DenshiとMoji_JohoでIVSをシェアしようとしてるが、グリフに差異が見られる例」については、いくつか見つけたものの、リストの最初のほうしかチェックできなかったので、言及するのを断念。他にも、CJK互換漢字グリフの扱い、Ken Lundeさんが挙げていた(CJK Type: PRI 259)U+6723とU+81A7の問題など、いろいろ論点はあると思うが、今回はスルーした。 iPhoneや携帯における絵文字の扱いに関して、SoftBankへの要望がいくつかあるので(それから、先日コメント欄でお願いされたので)、メモ。 その1・

    Mac OS Xの文字コード問題に関するメモ
    syuu1228
    syuu1228 2012/04/24
    この人のブログすごいな。全部文字コードの話ばっかり:Mac OS Xの文字コード問題に関するメモ
  • SoftBank iPhoneのShift_JISがすごいことになっている件 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    下図は、SoftBank iPhoneのMailが用いるShift_JISのIBM拡張文字領域*1。どうだ、驚いたろう。 SoftBank iPhoneのMailは、charset=Shift_JISをよく使う。髙村薫の「髙」や宮﨑あおいの「﨑」などのWindows外字もShift_JISで送るし、絵文字もShift_JISで送る。しかし、WindowsのIBM拡張文字領域とSoftBankの絵文字領域は、もともと衝突しており、共存できない。なので、SoftBank iPhoneのShift_JISでは、IBM拡張文字のうち下図ピンク部分が使えない。 だったらその分は、NEC選定IBM拡張文字のほうを使えばいいじゃないですか、どうせダブってるんだから(下図)。というのが、大ざっぱに言えば、SoftBank iPhoneのMailが用いるShift_JISである。 その外字領域をまとめると、

    SoftBank iPhoneのShift_JISがすごいことになっている件 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
    syuu1228
    syuu1228 2012/04/24
    SoftBank iPhoneのShift_JISがすごいことになっている件 - Mac OS Xの文字コード問題に関するメモ
  • なぜAppleカラー絵文字のプードルには眉毛があるのか - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    ここに2匹のプードルがいるんだけどね。 間違い探しですか? ズバリ、左にだけ眉毛がありますね。 うん。眉毛があるほうが、iPhoneやLionに入ってる絵文字フォントのプードル。眉毛のないほうが、Unicodeのコードチャートに載ってるプードル。 えっ、どういうことですか? そもそもUnicodeにケータイ絵文字を入れようって提案したのがGoogleAppleだからね。提案書のための絵文字Appleが用意して、それがUnicodeに収録された。そのあとで、iPhone絵文字に含まれていなかった文字については、データを流用して絵文字フォントに追加したってことじゃないかな。 だからほとんど同じなんですね。でも、眉毛はどうなりました? ケータイ絵文字をUnicodeに収録する過程では、いろいろあってさ。たとえば、日絵文字のマンガっぽさをめぐる戦いとか。ほら、アイルランド・ドイツ修正案って

    なぜAppleカラー絵文字のプードルには眉毛があるのか - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
    syuu1228
    syuu1228 2012/02/14
    なぜAppleカラー絵文字のプードルには眉毛があるのか - Mac OS Xの文字コード問題に関するメモ
  • 1