タグ

文字コードに関するrok-sanのブックマーク (2)

  • iPadで表示できない文字 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    yanokさんの「iPod TouchはJIS X 0213の全ての文字に対応しているわけではなかった」というエントリを読んで、iPadで確認してみた。具体的には、ヒラギノProNに含まれるグリフのうちUnicodeマッピングのあるものをすべて含むテキストを作成し、iPad上のアプリケーションで開き、目で見てゲタを拾った。アプリケーションによって若干の違いはあるようだが、iPadで表示されないことがあった文字は、下図のとおり。 最初は、軽量化のために一部のグリフを外しているのかと思ったが*1、Cédilleというツールで見てみると、iPadのヒラギノProNには、グリフはフルに入っているようだ(下図)。 そのようなわけで、前述の文字が表示されない理由、あるいは表示されない文字の共通点はわからない。強いて言えば「ヒラギノStdのcmapでマッピングのない非漢字」というのが共通点だが、iPad

    iPadで表示できない文字 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
  • アジアのペンギン: MacOS X とのファイル共有

    おひさしぶりです。moriyama です。 今回は、Linux でファイルサーバーを構築する際に、Windows 以外にも MacOS X も接続してファイル共有する場合の日語ファイル名の扱いについて書こうと思います。 MacOS X のパス名 MacOS X ではパス名の文字コードは UTF-8 です。そして Unicode Normalization Form D (NFD) と呼ばれる Unicode の正規化処理を施してあります。そのため MacOS X では「が」を「か」と結合文字の濁点「゛」に分解されてエンコードされる事になります。 合成済みの文字と分解された文字のコード値は次のようになっています。 コード値(スカラ値)UTF-8 バイト列 濁点「゛」のコード値は U+309B ではなく、結合文字は別コードポイントが用意されていて U+3099 です。 ファイル名やディレクト

  • 1