タグ

ブックマーク / moji-memo.hatenablog.jp (14)

  • なんたら統一文字の面積比の正確な図 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    戸籍統一文字、住基ネット統一文字、登記統一文字に含まれる漢字の数について、面積比が正確になるように図を描いてみた*1。 法務省が戸籍のオンライン手続きのために整理した文字集合が、戸籍統一文字。この戸籍統一文字を拡張した文字集合が登記統一文字であり、拡張部分を登記固有文字と呼ぶ。図にすると、こんなかんじ。 総務省の住民基台帳ネットワーク統一文字(住基ネット統一文字)には、法務省の戸籍統一文字・登記統一文字との互換性はない。図にすると、こんなかんじ。 この図に、JIS X 0208とJIS X 0213も入れてみる。住基ネット統一文字は基的にJIS X 0213ベースだが、「JIS X 0213に含まれていて戸籍統一文字に含まれていない漢字」は、けっこうある。 IPAの文字情報基盤整備事業が対象としているのは、オレンジ色の枠で囲んだ部分。登記固有文字がんばれ。 *1:使っている数字は、『汎

    なんたら統一文字の面積比の正確な図 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
    otsune
    otsune 2013/08/08
  • この「邉」を作ったのは誰だぁ!! - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    『Unicode IVS/IVD入門』(田丸健三郎、小林龍生)のなかで、目玉がWindows 8のIVS対応を紹介している第2章だとするなら、背骨といえるのが、IVSという枠組み自体について解説している第5章だよね。 たとえがしっくりきませんが、こだわらずに先に進みましょう。 その第5章のなかでも、IVSの基中の基をわずか1行に凝縮して視覚化しているのが、図5-7だ。 はいはい。 で、今日は図5-7に突っ込んでみようと。 もちろん、突っ込みますよー! あのさ、そういうテンションいらないから。この図なんだけど、どう? んー、解説抜きで見せられても、ちょっと難しいですね。 いや、当は難しくないんだよ。「漢字に異体字セレクタを付けるとグリフを指定できます」って言ってるだけの図なんだから。 この真ん中の「E010B」が右では「E0110」に変化してるのは、どういう意味なんですか? 誤植だね。

    この「邉」を作ったのは誰だぁ!! - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
    otsune
    otsune 2013/04/23
  • バルカン星人のUnicode侵攻 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    そんなわけで、アイルランドがUCS(Unicode)に押し込んだ3つのハンドジェスチャーのうち最後の1つが、これなんだけどね。 わあ! またやばそうなのが来ました! これがやばく見えるなら、それは心の鏡に映ったきみ自身のやばさを見てるんじゃないかな。 ちょっと何言ってるかわかんないです。 『スタートレック』って観たことある? わりと最近のリメイク版なら観ましたけど。 んー、それはリメイク版じゃなくて、映画版の第11作だろうな。まあ、そんなことはいいんだけど、つり眉でおかっぱ頭でエリートくさいスポックっていうバルカン星人が出てきたでしょ? 名前は忘れましたけど、いましたね、おかっぱ星人。 で、そのバルカン星人のスポックが、手をこんな形にして「長寿と繁栄を!」って言ってなかった? 言われてみれば、そんなシーンがあったような、なかったような。 それがバルカン式挨拶(Vulcan salute)だ

    バルカン星人のUnicode侵攻 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
    otsune
    otsune 2013/02/04
  • Lionにナマハゲと天狗が入っているのはどうして? - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    Appleカラー絵文字って何? iPhoneやLionに搭載されている絵文字フォントの名前だよ。Lionをインストールすると、iPhoneのカラー絵文字Macでも使えるようになるんだ。文字ビューアの「絵文字」から入力できるよ。 iPhoneとLionでは、絵文字に違いはあるの? いちばん目立つ違いは、Lionでは文字が増えてることかな。 わあ、どんなのが増えたの? ナマハゲとか天狗とかナルトとか。 これ、モノクロじゃん。 増えてるぶんは、ぜんぶモノクロ。Lionは、Unicodeに収録されたケータイ絵文字のうち、Softbank絵文字以外を、いわば「docomo/au互換絵文字」としてモノクロでサポートしている*1。このモノクロの絵文字は、文字ビューアの「絵文字」には表示されない。Font Bookでレパートリーを表示すると、下のほうに入ってるよ。 Gmailを使えば、以前からMacでも

    Lionにナマハゲと天狗が入っているのはどうして? - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
    otsune
    otsune 2011/07/26
  • 「●」が小さく見えることがあるのはどうして? - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    (ホー先生)Macの画面で「●▲■」の「●」と「■」だけが小さく見えることがあるのはなぜじゃ*1。 「●」と「■」が欧文フォントで表示されているからだよ。たとえばMacのFinderでは、ファイル名は「Lucida Grande優先」で表示される。Lucida Grandeは「●(U+25CF)」や「■(U+25A0)」のグリフを持っているけれど、「▲(U+25B2)」のグリフを持っていない。だから「▲」はヒラギノで表示されて、「●」と「■」だけが小さく見えるんだ。同じ理由で起きる現象としては、三点リーダの位置が下にズレたりすることも、よくあるよね。 Finder以外でもよくあるんじゃが。 Appleのソフトは世界共通の仕様なので、デフォルトは欧文フォントだよ(下図)。 日フォントを指定すれば、この問題は避けられるのか。 うん。Finderでは基的にフォントの変更はできないけどね。そ

    「●」が小さく見えることがあるのはどうして? - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
    otsune
    otsune 2011/04/18
  • ハイフンの仲間たちの混乱 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    Adobe-Japan1-7に向けて以前書いたことを蒸し返してみるシリーズ、第2弾。横棒型のグリフをめぐる混乱について。以下の図は、ハイフン、ENダッシュ、EMダッシュ、マイナス記号、プラス記号を入力し、左からプロポーショナル(pwid)、イタリック(ital)、全角(fwid)、半角(hwid)、三分(twid)、四分(qwid)のタグを適用したもの。グレー地は文字幅。正方形の枠は全角の目安。 下図はヒラギノ。「ハイフンの半角字形」と「マイナス記号の半角字形」(赤枠)のデザインが、他と揃っていない。 これを直してみたのが、下図。まず、「ハイフンの半角字形」には、適切なグリフが存在しない。CID+244はハイフンとマイナス記号に共通の半角グリフであるため、ヒラギノのように両者のデザインを区別する体系では、無理が生じてしまう。この問題を解決するためには、「ハイフン専用の半角字形」(下図A)を

    ハイフンの仲間たちの混乱 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
    otsune
    otsune 2010/05/28
  • Safariがバックスラッシュを円記号に置き換える理由がわからない - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    nurseさん(はてなるせだいあり)の詳細なリポート「円記号問題とウェブブラウザ」によると、Safariの「EUC-JPのページの0x5Cを円記号として表示する」という動作の背景には、「ユーザはそうして欲しいはずだ」という(WebKitの開発者の)信念があるらしい。 しかし、そのようなニーズは当に存在するのだろうか。来バックスラッシュであるEUC-JPの0x5Cをブラウザが円記号に置き換えて表示しても、ページ作成者にとっては自分のミスに気付くチャンスが減り、閲覧者にとってはダメな通販サイトを見分けるヒントが減るだけだと思うのだけれど。

    Safariがバックスラッシュを円記号に置き換える理由がわからない - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
    otsune
    otsune 2010/05/27
  • 複数行にまたがる括弧はなぜズレるのか - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    InD-Boardで出ていた「複数行にまたがる括弧」の話が興味深かったので、ちょっと調べてみた。皆さんの指摘に付け加えるような知見はないのだけれど、以下、文字コード的な雑談として。 Unicodeには、複数行にまたがる丸括弧、角括弧、波括弧がある(下図)。このうち2文字で作る波括弧は、左上と右下、左下と右上のパーツが共通なので、文字数としては、ここまでで16文字。 これらの括弧には、拡張用の直線パーツ(下図、グレー地)が用意されている。丸括弧用と角括弧用はそれぞれ左右別々、波括弧用のみ左右共通で、文字数としては5文字。しかしAdobe-Japan1では、これら5文字がすべてCID+12167に集約されており、区別してデザインすることができない。 下図は小塚明朝。角括弧の拡張はうまくいっているが、丸括弧と波括弧は直線部分がズレている。また、2文字分の波括弧のパーツは、おそらく左右共用ではなく

    複数行にまたがる括弧はなぜズレるのか - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
    otsune
    otsune 2010/03/26
  • ディスクユーティリティの誤訳 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    起動ディスク(Macintosh HD)のバックアップを外付けハードディスク(My Book)に保存しようとしてディスクユーティリティを立ち上げた。ソースとしてMacintosh HDを、保存先としてMy Bookを指定。「復元」をクリックしたところで、確認のアラート(下図、Mac OS Xのバージョンは10.6.2)を見て凍りついた。「"My Book"(保存先)上のファイルだけがそのまま残ります」って、オリジナル(Macintosh HD)のファイルはどこへ消えますか? わけがわからないので、言語を日語ではなく英語にしてからディスクユーティリティを立ち上げ、同じ操作をしてみた。表示されたアラートは、下図の通り*1。 コンピュータまわりでは変な訳は珍しくないけれど、この場面でのこの誤訳はちょっとひどいと思う。日語のアラートを見て「復元」をクリックできるのは勇者。 *1:一応訳しておく

    ディスクユーティリティの誤訳 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
    otsune
    otsune 2010/01/30
  • メイリオの欝 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    メイリオの「欝」は、なぜ全角じゃないのだろう。FontForgeで見ると、「欝」の幅は2069(下図)。全角の(たとえば「」の)幅は2048だから、それより微妙に値が大きい。 いつもここに載せているような表をInDesignで作っていて、オーバーフローしたので原因を調べたら、この字のせいだった。他に類似の例があるかどうかは確認していない。

    メイリオの欝 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
    otsune
    otsune 2009/12/04
  • 日本語OpenTypeフォントの分裂の歴史 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    CMapの系統図を描いてみた。 上図左上、源流となっているUniJIS-UCS2は、Adobe-Japan1-4(AJ14)をレパートリとするCMapである。 Appleは、2001年9月リリースのMac OS X 10.1でApple Publishing Glyph Set(APGS)を投入し、JIS X 0213:2000をサポートした。APGSはレパートリとしてはAJ14のスーパーセットだが、主にJIS X 0213との整合性を高めるために、既存のマッピングに変更が加えられている。 2002年9月、AdobeはAPGSを追認する形でAdobe-Japan1-5(AJ15)を策定したが、Appleによるマッピング変更の一部(主としてプロポーショナル・グリフの採用)には追随しなかった。このためAJ15以降のCMapには、Apple用のもの(UniJISX0213系)とそれ以外(UniJ

    日本語OpenTypeフォントの分裂の歴史 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
    otsune
    otsune 2009/07/19
  • Mac OS Xの文字コード問題に関するメモ

    文字情報基盤(Moji_Joho)のIVS登録にともなう公開レビュー(PRI 259)にコメントした。PDFはこちら。日語。もう、最初から最後まで日語。 安岡孝一さんが挙げていた(yasuokaの日記:文字情報基盤のIVS登録第1弾)ような「Hanyo-DenshiとMoji_JohoでIVSをシェアしようとしてるが、グリフに差異が見られる例」については、いくつか見つけたものの、リストの最初のほうしかチェックできなかったので、言及するのを断念。他にも、CJK互換漢字グリフの扱い、Ken Lundeさんが挙げていた(CJK Type: PRI 259)U+6723とU+81A7の問題など、いろいろ論点はあると思うが、今回はスルーした。 iPhoneや携帯における絵文字の扱いに関して、SoftBankへの要望がいくつかあるので(それから、先日コメント欄でお願いされたので)、メモ。 その1・

    Mac OS Xの文字コード問題に関するメモ
    otsune
    otsune 2007/01/20
  • Windows Vistaのjp90タグにおける「喩」の問題 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    Microsoftのサイト(JIS X 0213:2004 対応と新日フォント「メイリオ」について)から入手できる資料には、Windows VistaのMSゴシックおよびMS明朝について、以下のような記述がある。 字形セットとしては、Windows XPで利用可能だった122文字のJIS90字形に、'jp90' OpenType feature tagによりアクセスができるようになっています。 この122文字のリストには、「喩」が含まれている*1。そして、「喩」については、「JIS90字形」欄のグリフ(「人」形)は、「JIS90字形」ではない。逆に、「JIS2004字形」欄のグリフ(「入」形)のほうが「JIS90字形」である。 JIS X 0208の規格票における「喩」の例示字体は、JIS78とJIS83では「人」形、JIS90以降は「入」形。つまり、JIS78もJIS83も略字風の字

    Windows Vistaのjp90タグにおける「喩」の問題 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
  • ヒラギノでは全角でデザインされていない文字 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    たとえば「○か×か」というテキストをヒラギノで表示した際、「×」だけが小さく見えて困惑したといった経験を、多くのMac OS Xユーザが持っていると思う。これは、ヒラギノがU+00D7 MULTIPLICATION SIGN(乗算記号)をプロポーショナルでデザインしているためである。そんなわけで、JIS X 0208の範囲内のいわゆる「全角文字」のうち、ヒラギノでは全角でデザインされていない文字のリスト(ヒラギノ丸ゴ Pro W4、バージョン7.11で表示)を作成してみた。目で見て拾っただけなので、漏れなどがあるかもしれない。 このうちセント記号(U+00A2 CENT SIGN)、ポンド記号(U+00A3)、否定記号(U+00AC)がプロポーショナルなのは、Unicodeの範囲内には他に全角バージョン(U+FFE0 FULLWIDTH CENT SIGN、U+FFE1 FULLWIDTH

    ヒラギノでは全角でデザインされていない文字 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
  • 1