タグ

ブックマーク / moji-memo.hatenablog.jp (6)

  • CJK統合漢字拡張Fがヤバイ - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    がCJK統合漢字拡張F1/F2に提案している文字には、すでにUCSに入っている漢字と見分けがつかない例がいくつもある。これらは、提案書*1に「Similar and Variation」として既存の文字の符号位置が記載されているものの一部であり、つまり、似ている漢字の存在は百も承知で提案しているわけだ。 以下、そのような例を拾ってみた。左右に並べた文字のうち「UCS」欄に符号位置が入っているほうが、既存のもの。個々の文字について述べることはしないが、要するに「別字の衝突であれば、形が同じでも別の符号を与える」ということだろう。 だが、ちょっと待ってほしい。それって実はものすごく根的な方針転換じゃないですか? 「機」の簡体字の「机」も「つくえ」の「机」も、形が同じである以上、同じ符号位置(U+673A)に包摂・統合するというのがCJK統合漢字の大原則であったはず*2。ここでいきなりそれ

    CJK統合漢字拡張Fがヤバイ - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
    Guro
    Guro 2013/11/12
  • iOS 7にしたら送信したメッセージが化けるようになった(直りました) - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    この項10月28日追記。iOS 7.0.3でSoftBank iPhoneのメールアプリの仕様が修正された。 「iOS 7にしてから文字化けするようになった」という話には、知る限りにおいて2つのパターンがある。1つ目は「SoftBank iPhoneで受信したメールの絵文字が表示されない」というもの。その原因については、前回と前々回に述べた。2つ目は「送信したメールのすべての文字が相手先で化ける」というもの。今回は、こちらについて述べる。 この現象も、前回・前々回の話とつながっている。簡単に言うと、iOS 7のメールアプリは「SoftBank独自」の処理を行っていないように見える。このため、「これまでは(au iPhoneなどではcharset=CP932になるが)SoftBank iPhoneではcharset=Shift_JISになっていた」というケースで、charset=CP932に

    iOS 7にしたら送信したメッセージが化けるようになった(直りました) - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
  • JIS X 0213:2004の「解説」に突っ込んでみる - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    IVSに突っ込んでいたら、その記述の元となっているJIS X 0213の「解説」の誤りらしきものを発見、というパターン。3つたまったので、まとめてメモしておく。 3.1.2 この規格の2000年版、JIS X 0208及びUCSに同一の字形があった815字 「これら815字のうち5字には、簡易慣用字体が示されている」とあるが、815字のうち簡易慣用字体が示されているものは7字ある(下図)。 このうち「ここで簡易慣用字体として示された五つの字形と同一の字形が、この規格の2000年版、JIS X 0208及びUCSに例示字形として示されている」に該当するのは、「頴撹曽桝弯」の5字。 「815字」の内訳については「815文字の計算方法とリスト」を参照。 3.1.4 微細なデザイン差を変更した39字 「表外漢字字体表に示された1022字のうち39字については、表外漢字字体表の意味でのデザイン差が

    JIS X 0213:2004の「解説」に突っ込んでみる - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
    Guro
    Guro 2013/06/10
  • 昔のグリフで出ています - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    今日はWindows 8のMS明朝における122字のIVS実装について説明しようと思ってたんだけど……。 気が変わったんですか? 話が長くなりそうなんで、詳しいことは後日に回して、今回は説明のカギになる「MS122」という文字集合に焦点を絞って語ってみようかと。 「MS122」ですか? トラック野郎が荷台に貼ってるお茶目なステッカーの「人110」と、ちょっとだけ似てますね。 あー、こないだそれ貼ってるトラック見た見た! 正確には「美人110番の車」な。って、「MS122」と、ひとかけらも似てないだろが! まさかのノリツッコミ。 まず、基を押さえておくとWindows Vistaでは…… 強引な軌道修正。 ……JIS X 0213:2004の例示にあわせる方向で、MS明朝の字形を変更したわけだ。 はいはい。それが122字だったんですね? まあ、落ち着こうぜ。変更された字は、漢字だけでも

    昔のグリフで出ています - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
    Guro
    Guro 2013/05/16
  • Mac OS Xの文字コード問題に関するメモ

    文字情報基盤(Moji_Joho)のIVS登録にともなう公開レビュー(PRI 259)にコメントした。PDFはこちら。日語。もう、最初から最後まで日語。 安岡孝一さんが挙げていた(yasuokaの日記:文字情報基盤のIVS登録第1弾)ような「Hanyo-DenshiとMoji_JohoでIVSをシェアしようとしてるが、グリフに差異が見られる例」については、いくつか見つけたものの、リストの最初のほうしかチェックできなかったので、言及するのを断念。他にも、CJK互換漢字グリフの扱い、Ken Lundeさんが挙げていた(CJK Type: PRI 259)U+6723とU+81A7の問題など、いろいろ論点はあると思うが、今回はスルーした。 iPhoneや携帯における絵文字の扱いに関して、SoftBankへの要望がいくつかあるので(それから、先日コメント欄でお願いされたので)、メモ。 その1・

    Mac OS Xの文字コード問題に関するメモ
  • 「改定常用漢字表」に関する試案の「韓」と「稽」 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    下図は、「改定常用漢字表」に関する試案の「表の見方」の12の(3)。「*」の付いた字というのは、「彙茨淫牙葛韓嗅僅惧稽恣煎詮箋嘲捗溺賭箸蔑喩」の21字。この部分に関して疑問が2点ほどあるのだが、わたしがわかっていないだけという可能性も大いにあるので、文化文化部国語課にコメントする前に、ここにメモして皆さまの突っ込みを待とうと思う。 疑問の1つ目は「韓」について。下図のような違いを「字体上の差異」とするべきだろうか。 下図は、「韓」と似た部分字体を持つ「芽」の例。これらは「字体上の差異」ではなく「デザイン差」とされている。 疑問の2つ目は「稽」について。「昭和56年の制定当時から常用漢字表に入っていた字体」とは「同じ構成要素を持ちながら通用字体の扱いに字体上の差異がある」というのだけれど、その「昭和56年の制定当時から常用漢字表に入っていた」字って何だろう?

    「改定常用漢字表」に関する試案の「韓」と「稽」 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
    Guro
    Guro 2009/12/20
  • 1