タグ

UTF-8-MACに関するtA9のブックマーク (2)

  • とあるプログラマーの覚書 MacでのUTF-8の取り扱い

    マルチプラットフォーム&多言語対応したアプリケーションを作る場合に考えないと行けないのが、文字コードです。 で、UTF-8でやろうということになったのですが・・・。 一通り、プロトタイプを作って、いざ、WindowsMacで動作確認してみると、Macで作った日語を含むUTF-8Windowsで使おうとすると・・・。 なんか変。 文字化けしてます。 で、検索してみると、割と有名な話みたいでした。 UTF-8には何種類か符号化の方法があって、一般的にはNormalization Form C(NFC)というものが使われていますが、Mac OSXではNormalization Form D(NFD) が使われています。 ということで、MacUTF-8な文字データをそのままWindowsへ渡すと、うまく扱う事ができません。 普段は、そもそもWindowsMacでファイルのやり取りする時は

  • nnn UTF-8-MAC問題 解決っぽい?

    過去に、Linuxサーバでファイル共有をしていたときに、Mac側からはNFSで、 Windows側からはSambaでアクセスしていたことがあって、そのときにファイル名の エンコーディングはUTF-8にしていたんですが、どうもファイル名の表示がおかしい、 濁点などが入ると変だということに気づき、調査していたのです。 調査でわかったことは下記のとおり。 MacOSXはUTF-8のファイル名といっても、Normalization Form Dという文字とコードポイントの対応方法をとっている。これにより、濁点のついた文字は2つのコードポイントに分解される。(例:バ→ハ+濁点コードポイント) MacOSXは分解されていない文字列も正しくデコードできる。 WindowsMacOSXのような変換を行わずにそのまま1文字が1コードポイントに対応するようなUTF-8で保存している。(例:バ→バのま

  • 1