タグ

ブックマーク / www.nakano.gr.jp/~jnakano (1)

  • nnn UTF-8-MAC問題 解決っぽい?

    過去に、Linuxサーバでファイル共有をしていたときに、Mac側からはNFSで、 Windows側からはSambaでアクセスしていたことがあって、そのときにファイル名の エンコーディングはUTF-8にしていたんですが、どうもファイル名の表示がおかしい、 濁点などが入ると変だということに気づき、調査していたのです。 調査でわかったことは下記のとおり。 MacOSXはUTF-8のファイル名といっても、Normalization Form Dという文字とコードポイントの対応方法をとっている。これにより、濁点のついた文字は2つのコードポイントに分解される。(例:バ→ハ+濁点コードポイント) MacOSXは分解されていない文字列も正しくデコードできる。 WindowsMacOSXのような変換を行わずにそのまま1文字が1コードポイントに対応するようなUTF-8で保存している。(例:バ→バのま

  • 1