タグ

ブックマーク / moji-memo.hatenablog.jp (48)

  • Unicodeで見る各国の十二支 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    もうすぐお正月だし、こんな図を作ってみたんだけどね。 十二支ですか? いろんな国の十二支? そうそう。実はこれ全部、「どこの国の十二支の何番目の動物」という情報まで含めて、Unicodeのコードチャートに載ってるものなんだよね。 いちばん左の列が標準的な十二支ってことですね。 うん。日だと、12番目のイノシシだけが独自仕様だな。それが標準仕様だとブタ。 カザフスタンでは、来年の干支はカタツムリですか。 よくわからないけど、そうなのかな。 このペルシアのネズミは、どうして小さいんですか? 標準仕様のネズミの絵を縮小したみたいに見えますけど。 それはネズミの種類が違うんだよ。ドブネズミとハツカネズミ。 え? でもこれ、文字なんだから、たとえばゾウでもアリでも同じ大きさに描かれるものですよね。 原則は、そうだね。 じゃあ、どうしてドブネズミを縮小したのがハツカネズミなんですか? まあ、ちょっと

    Unicodeで見る各国の十二支 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
    tarchan
    tarchan 2012/01/31
    標準の十二支ってどこの国の十二支なの?
  • 「●」が小さく見えることがあるのはどうして? - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    (ホー先生)Macの画面で「●▲■」の「●」と「■」だけが小さく見えることがあるのはなぜじゃ*1。 「●」と「■」が欧文フォントで表示されているからだよ。たとえばMacのFinderでは、ファイル名は「Lucida Grande優先」で表示される。Lucida Grandeは「●(U+25CF)」や「■(U+25A0)」のグリフを持っているけれど、「▲(U+25B2)」のグリフを持っていない。だから「▲」はヒラギノで表示されて、「●」と「■」だけが小さく見えるんだ。同じ理由で起きる現象としては、三点リーダの位置が下にズレたりすることも、よくあるよね。 Finder以外でもよくあるんじゃが。 Appleのソフトは世界共通の仕様なので、デフォルトは欧文フォントだよ(下図)。 日フォントを指定すれば、この問題は避けられるのか。 うん。Finderでは基的にフォントの変更はできないけどね。そ

    「●」が小さく見えることがあるのはどうして? - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
  • iPadで表示できない文字 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    yanokさんの「iPod TouchはJIS X 0213の全ての文字に対応しているわけではなかった」というエントリを読んで、iPadで確認してみた。具体的には、ヒラギノProNに含まれるグリフのうちUnicodeマッピングのあるものをすべて含むテキストを作成し、iPad上のアプリケーションで開き、目で見てゲタを拾った。アプリケーションによって若干の違いはあるようだが、iPadで表示されないことがあった文字は、下図のとおり。 最初は、軽量化のために一部のグリフを外しているのかと思ったが*1、Cédilleというツールで見てみると、iPadのヒラギノProNには、グリフはフルに入っているようだ(下図)。 そのようなわけで、前述の文字が表示されない理由、あるいは表示されない文字の共通点はわからない。強いて言えば「ヒラギノStdのcmapでマッピングのない非漢字」というのが共通点だが、iPad

    iPadで表示できない文字 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
  • Illustrator CS4におけるグリフ置換の文字化け - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    たとえばIllustrator CS4でCID+14281を入力し、その後フォントを変更したとき。下図、左がフォント変更前、右が変更後。フォントの違いによって、同じグリフが4種類もの異なる化け方をしている。 このような文字化けは、「親字の符号位置と異体字(aalt)番号」によってグリフを指定する仕組みに起因するもので、InDesignでは2.0の時代に見られたものである。 cmapテーブル、aaltテーブル、またはレパートリが異なるフォント間で化ける可能性があり、どのグリフが化けるのかをトータルに把握するのは難しい。たとえば上の図のいちばん下の例では、cmapもaaltも同系統であるモリサワのPr6とProの間で、レパートリの違いによって化けている。 化けるのは漢字とは限らず、aaltで表現されている記号類は、かなりの確率で化ける。下図は、適当に拾ったごく一部の例。 CS以降のInDesi

    Illustrator CS4におけるグリフ置換の文字化け - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
    tarchan
    tarchan 2009/11/26
    プロダクトでかすぎて同じアプリ内でも機能ごとに情報断絶がありそう
  • Snow LeopardのMailはUTF-8のメールを量産する - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    Apple Mail(Mail.app)がcharset=ISO-2022-JPのメッセージを表示する際の変換テーブルが、おかしい。 WindowsMacでは、JIS X 0208に含まれる文字の範囲において、下図のようなUnicodeマッピングの相違が存在する。たとえばWindowsはJIS X 0208の1区33点「〜」(波ダッシュ)をU+FF5E FULLWIDTH TILDEと解釈し、Macは同じ文字をU+301C WAVE DASHと解釈する。 ところがMac OS X 10.6 Snow LeopardのMail 4.1(1076)は、Apple製の(そしてもちろんMac専用の)アプリケーションであるにもかかわらず、上図のすべての文字について、Windows側のマッピングによってcharset=ISO-2022-JPのメッセージを解釈する。 その一方でMailは、「Unico

    Snow LeopardのMailはUTF-8のメールを量産する - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
  • 日本語OpenTypeフォントの分裂の歴史 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    CMapの系統図を描いてみた。 上図左上、源流となっているUniJIS-UCS2は、Adobe-Japan1-4(AJ14)をレパートリとするCMapである。 Appleは、2001年9月リリースのMac OS X 10.1でApple Publishing Glyph Set(APGS)を投入し、JIS X 0213:2000をサポートした。APGSはレパートリとしてはAJ14のスーパーセットだが、主にJIS X 0213との整合性を高めるために、既存のマッピングに変更が加えられている。 2002年9月、AdobeはAPGSを追認する形でAdobe-Japan1-5(AJ15)を策定したが、Appleによるマッピング変更の一部(主としてプロポーショナル・グリフの採用)には追随しなかった。このためAJ15以降のCMapには、Apple用のもの(UniJISX0213系)とそれ以外(UniJ

    日本語OpenTypeフォントの分裂の歴史 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
  • 横組み用仮名(hkna)と縦組み用仮名(vkna)は使うべきか - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    OpenTypeのProフォントには、横組み用仮名(hkna)、縦組み用仮名(vkna)というフィーチャがあり、InDesignでは文字パネルのメニューで「OpenType機能>横または縦組み用かな」にチェックを入れて利用する。 このフィーチャは、実装にバラツキがある。モリサワ・フォントでは、デフォルト、横組み用、縦組み用の仮名を区別していない。ヒラギノでは、横組み用とデフォルトを区別し、縦組み用とデフォルトの区別はない。小塚書体は三者を区別している。 下図は、ヒラギノ明朝のデフォルトの仮名をグレー、横組み用を赤で示し、それを重ねてみたもの。横組み用(hkna)では、縦書きとの運筆の違いを反映して「い」が2画目のハネのない形となっているほか、横組みベタの際の文字間のアキが均一となるよう、総じて(特に縦長の文字の)幅が広めにデザインされている。 ちなみにご存知のとおり、横組み用仮名をデフォル

    横組み用仮名(hkna)と縦組み用仮名(vkna)は使うべきか - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
  • ケータイの絵文字はどこまでズレるのか - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    ケータイの絵文字について、各キャリアの「他社用変換表」を見ると、ゲタにするよりはマシだろうということなのだろうが、けっこう強引というか、感覚的な対応も多く、ラウンドトリップの互換性は保証されない。 つまり、絵文字入りのメールを他社ケータイに送信し、さらにそれを引用して送信するというプロセスを繰り返した場合、伝言ゲームのように少しずつ絵文字の意味がズレていく可能性がある。 というわけで下図は、適当に拾った例で、絵文字がどんなふうに変化していくのかシミュレートしたもの(16進数はShift-JISコード)。文脈によっては、キケンなニュアンスに変わったりすることもあるかも。

    ケータイの絵文字はどこまでズレるのか - 帰ってきた💫Unicode刑事〔デカ〕リターンズ