タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

Unicodeに関するnakaearthのブックマーク (1)

  • Unicode正規化(NFC,NFD,etc…) - SD MILIEU

    Unicode では、特定の文字を表現する方法が複数存在する場合がある 例えば「ボ」という文字を表現する場合、合成文字(U+30dc)と結合文字(U+30db U+3099)の2通りの方法が存在する こういう合成文字・結合文字2通りの表現方法が存在する文字をどちらかに変換する事を「Unicode 正規化」という(正確には正準等価とか互換等価とかの話があるけど一旦おいておく) ちなみに正規化とは「正規化(せいきか、英: normalization)とは、データ等々を一定のルール(規則)に基づいて変形し、利用しやすくすること。(by Wikipedia)」 合成文字への変換をNFC、結合文字への変換をNFDと呼ぶ Mac のファイルシステムHFS+では、NFD(の変化形)を使用しているため、Mac のファイル名では「ボ」は結合文字として扱われている 他にも、MacPDF 内の文章をコピペ

  • 1