タグ

文字コードに関するnanicaのブックマーク (1)

  • アジアのペンギン: MacOS X とのファイル共有

    おひさしぶりです。moriyama です。 今回は、Linux でファイルサーバーを構築する際に、Windows 以外にも MacOS X も接続してファイル共有する場合の日語ファイル名の扱いについて書こうと思います。 MacOS X のパス名 MacOS X ではパス名の文字コードは UTF-8 です。そして Unicode Normalization Form D (NFD) と呼ばれる Unicode の正規化処理を施してあります。そのため MacOS X では「が」を「か」と結合文字の濁点「゛」に分解されてエンコードされる事になります。 合成済みの文字と分解された文字のコード値は次のようになっています。 コード値(スカラ値)UTF-8 バイト列 濁点「゛」のコード値は U+309B ではなく、結合文字は別コードポイントが用意されていて U+3099 です。 ファイル名やディレクト

  • 1