タグ

IVSとUnicodeに関するseuzoのブックマーク (16)

  • Windows 8のIVS実装についてのまとめ - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    関連するエントリのインデックス。タイトルだけでは中身がわかりにくかったりするので、こういう形でまとめておくことにした。基的に、説明は上から順に読んでいただくのがいいかと。 説明(対話形式) MS122とは何か(昔のグリフで出ています) VistaにおけるMS明朝の字形変更(俺のMS明朝がこんなに可愛いわけがない) MS明朝・MSゴシックのIVS実装(人生がときめくWindows 8のIVS実装) メイリオのIVS実装(もし田村ゆかりがメイリオの実装に突っ込んだら) Windows 8のIVS実装一覧表 HTML版 画像版

    Windows 8のIVS実装についてのまとめ - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
  • 人生がときめくWindows 8のIVS実装 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    皆さんこんにちは、片づけコンサルタントのこんまり先生です。 いきなりの個人名詐称……。 今日は、Windows 8のIVS実装について説明するわよ。 「わよ」? 最初に結論を言っちゃうと、Windows 8のMS明朝・MSゴシックがIVSでサポートしているのは、MS122から「筵」を引いて「濹」を足した122文字ね。 ん? 以前のエントリでも言ったように、Windows Vistaで変更された文字のうち、jp90タグやJIS90互換フォントパッケージによって昔のグリフに戻せる122字を、MS122と呼ぶんだけどね。 MS122はいいんですけど、そこからまた引いたり足したりするんですか? うん。 じぁあまず、マイナス分の「筵」は、何なんですか? MS122のうち「喩」と「筵」については、XPグリフがJIS90の例示と一致しないんだよね。 ホントだー。 だから「喩」と「筵」のXPグリフ(JIS

    人生がときめくWindows 8のIVS実装 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
  • Amazon.co.jp

    seuzo
    seuzo 2013/05/08
    それでも★みっつ!
  • IVS本へのツッコミ・まとめ - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    『Unicode IVS/IVD入門』(田丸健三郎、小林龍生)の非公式正誤表のようなもの*1。第1章と第2章はWindows 8の話なので、見ていない箇所もある。間違いの量に興味がある方は、最初から読まずに、第4章(時系列的にはこれが最初のエントリ)あたりからどうぞ。 IVSへのツッコミ 第2章までへのツッコミ 第2章番外編「先生怒らないからリュウミンは手を挙げなさい」 第3章へのツッコミ 第4章へのツッコミ 第5章へのツッコミ 第5章番外編「この「邉」を作ったのは誰だぁ!!」 巻末付録の文字コード表へのツッコミ 関連するかもしれないエントリ セミナーでMicrosoftの人に質問するためのアンチョコ IVSアドインをインストールしてみたよ *1:さまざまな人からの情報をベースにしています。個々にお名前を挙げることはしませんが、皆さんありがとうございます!

    IVS本へのツッコミ・まとめ - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
    seuzo
    seuzo 2013/05/08
    まとめ
  • この「邉」を作ったのは誰だぁ!! - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    『Unicode IVS/IVD入門』(田丸健三郎、小林龍生)のなかで、目玉がWindows 8のIVS対応を紹介している第2章だとするなら、背骨といえるのが、IVSという枠組み自体について解説している第5章だよね。 たとえがしっくりきませんが、こだわらずに先に進みましょう。 その第5章のなかでも、IVSの基中の基をわずか1行に凝縮して視覚化しているのが、図5-7だ。 はいはい。 で、今日は図5-7に突っ込んでみようと。 もちろん、突っ込みますよー! あのさ、そういうテンションいらないから。この図なんだけど、どう? んー、解説抜きで見せられても、ちょっと難しいですね。 いや、当は難しくないんだよ。「漢字に異体字セレクタを付けるとグリフを指定できます」って言ってるだけの図なんだから。 この真ん中の「E010B」が右では「E0110」に変化してるのは、どういう意味なんですか? 誤植だね。

    この「邉」を作ったのは誰だぁ!! - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
  • IVS本へのツッコミ・付録の「文字コード表」編 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    『Unicode IVS/IVD入門』(田丸健三郎、小林龍生)へのツッコミ第2弾。このは、巻末に付録として2つの文字コード表を掲載しており、ページ数では全体の約半分に及ぶのだが、これらの表にもいろいろ問題があるように思う。 「USC」が215回出現 2つの文字コード表のうち「文字符号対応表(CP932とJIS文字コード)」(pp.218-325)のほうから見ていくこととする。 まず、全ページで(100ページ以上に渡って)「UCS」が「USC」になっている。 フォントの問題 「IPAmj明朝」欄の表示に使われているのはIPAmj明朝ではなくIPAex明朝だと思う(下図を参照)。 ちょっとわけがわからない。 「IPAmj明朝」欄の0x02から0x1b(制御文字領域)に記号や罫線素片が入っているが、IPAmj明朝にもIPAex明朝にも、このような文字は入っていない。 フォールバックで別のフォン

    IVS本へのツッコミ・付録の「文字コード表」編 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
  • 『Unicode IVS/IVD入門』へのツッコミ・第4章編 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    『Unicode IVS/IVD入門』(田丸健三郎、小林龍生)を読んでいたら、いくつか気になる点があったので、まとめてみることにした。とりあえず、第4章(37ページ分)だけ。時間と気力があれば、今後、他も追加していくかも*1。組版上の突っ込みは(ひどい例以外は)省いた*2。 p.103 ISO/IEC 8859は《中略》パート16まで定義されています(パート15は破棄)。 破棄されたのはパート12。 p.104 「ISO-10646」の文字集合 「ISO-10646」→「ISO/IEC 10646」。 たとえば、1面19区75点を符号位置とする文字をシフトJISで8ビット符号化した場合0x8A6Bとなる文字を例に見てみましょう。この文字は、葛飾区の「葛」という文字ですが 「葛」はシフトJISで「0x8A6B」ではなく「0x8A8B」。 p.106 「U+000000」→「U+0000」(U

    『Unicode IVS/IVD入門』へのツッコミ・第4章編 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
  • IVS本刊行記念セミナー(2013.3.29)

    「Unicode IVS/IVD入門」刊行記念セミナー http://kokucheese.com/event/index/74447/ 小形さんがセミナー当日の昼、「電話でMSの担当者にIVS実装のインタビューをした」と連投。ほとんど間をおかずにセミナーが開催。IVSでは分からなかった「MSのIVSに対する姿勢」がようやく明らかにされました。

    IVS本刊行記念セミナー(2013.3.29)
  • IVS本に容赦なく突っ込みまくるNAOIさん

    発行されたばかりの「Unicode IVS/IVD入門(日経BP社)」に突っ込むNAOIさん。誤植どころか「これ校正校閲してないんじゃないの?」と疑われるような間違いが続々と…

    IVS本に容赦なく突っ込みまくるNAOIさん
  • 渡邊の「邊」などの異体字の使い分け、MS Officeで可能に、IVSアドイン公開 

  • マイクロソフトのIVS対応 - ちくちく日記

    先日、マイクロソフトで「文字コードと異体字とUnicode IVS 〜情報システムにおける日語処理〜」というセミナーを受けてきた。 「文字符号化方式の正しい理解、文字コードの動向、そしてこれらを扱う上でどのような注意が必要なのかなど、IT 管理者、開発者に必要な基礎知識の理解を目指します。話題の IVS、IVD についてもご説明いたします。」 と、いうことで期待していったんだけど、さすがにこれだけの内容を2時間で話すというのは無理があったらしく、文字コードの概要についてダイジェストでお話、といった少々物足りない内容だった。 内容自体は物足りなくて、レポートにまとめるほどでもなかったんだけど、セミナー最後でのQ&AでマイクロソフトのIVS対応などについて触れられていたので、その部分だけメモがわりに。 ・IVSを使える環境でのIMEはどうあるべきか? IVSによって、様々な異体字へのアクセス

    マイクロソフトのIVS対応 - ちくちく日記
  • IVSに対するfont fallback | yasuokaの日記 | スラド

    「UnicodeのIVSがもたらすメリットとデメリット」の読者から、IVSに対するフォント・フォールバックはどうあるべきか、という趣旨の御質問をいただいた。たとえば、CSSのfont-familyで複数のフォントが指定してある場合に、最初のフォントに表示したいIVSが収録されていなかった時、表示プログラムはフォントの中をどう探していくべきか、という問題だ。 例として、3つのフォントが指定されている時に、「U+845B U+E0103」を表示するための理想的なフォント・フォールバックを、私(安岡孝一)なりに考えてみよう。 最初のフォントから「U+845B U+E0103」を探す。なければ 最初のフォントから「U+845B U+E0101」を探す。なければ 2番目のフォントから「U+845B U+E0103」を探す。なければ 2番目のフォントから「U+845B U+E0101」を探す。なければ

  • IVSと正規化について

    小形克宏 @ogwata Java 6はIVSを無視(ignore)しない。「Java 6 でIVSを比較すると何が起こるか」yanok.net http://yanok.net/2011/01/java-6-ivs.html

    IVSと正規化について
  • 50年に1度!? IVSをめぐる熱いw討論

    JEPAによる「出版物のUnicode化推進セミナー」をきっかけに、IVSについて熱く語り合った記録。思いがけず沢山の人が呼応してくれたので、まとめておきます。 IVSについては「UTS #37 UNICODE IDEOGRAPHIC VARIATION DATABASE」(http://unicode.org/reports/tr37/)、安岡孝一「漢字1文字が最大8バイト、Unicodeの「IVS」とは?」(http://itpro.nikkeibp.co.jp/article/COLUMN/20100126/343783/)、拙稿「包摂された字体を区別できる異体字シーケンス」(http://internet.watch.impress.co.jp/cda/jouyou/2008/09/09/20793.html)あたりをご参照ください。

    50年に1度!? IVSをめぐる熱いw討論
  • IVSは文字コードではない - yanok.net

    IVSを使うと、常用漢字体の「与」は以下の異なる符号化表現で表し得ます。 U+4E0E U+E0100 U+4E0E U+E0102 U+4E0E (※通常の日語環境では上2つと同じように見える筈。中国語環境などでは異なる) これが何を意味するかというと、画面上で同じ「与」という漢字が見えていても、その背後にある符号化表現は上の3つのいずれでもあり得るわけです。これがどのような不都合をもたらすかはいうまでもないでしょう。 文字コードというものは、文字を一意に符号化するものです。しかしIVSでは一意に符号化することは最初から考えられていないようです。つまり、IVSは文字コードではありません。 文字コードでないものをUnicodeのレベルで扱うのが適切なのか、再考を要するかもしれません。たとえばルビタグや言語タグのような文字コードでないものがUnicodeにはあって、こういうのはXMLなどで

  • IVD更新 - yanok.net

    最近、Unicodeのいわゆる異体字セレクタの新しいグリフコレクションが登録されました。今までは、Adobe-Japan1というコレクションが登録されていたのですが、今回それに加えて汎用電子と呼ばれる日の政府関係から提案されていたコレクションが追加されました。追加されたコレクションは、異体字データベース (Ideographic Variation Database; IVD) に累積的に追加されています。 IVDの文字表をちょっと見ると分かることですが、Adobe-Japan1と汎用電子とで、どう見ても同じようなグリフに対して別々のIVS (Ideographic Variation Sequence; IVS) が割り当てられています。例えば、「与」(U+4E0E)を見ると、Adobe-Japan1は長い横線の突き出ているグリフと突き出ていないグリフとにそれぞれ別のIVSを割り当てて

  • 1