タグ

文字コードに関するakirakiのブックマーク (2)

  • Mac OS 10.8 (Mountain Lion)でNFS領域をマウントする。 - TOYBOX

    FreeBSDでZFSを使ったファイルサーバを構築し、MacOSからNFSマウントして使い始めました。 マウントした後、日語を含むファイル名の文字コードの違いにより若干ハマったので、書き記しておきます。 MacOSの文字コードはUTF-8ではなく、UTF-8-MAC MacOS以外の一般的なシステムでは、UTF-8を使うのが一般的となり、Windowsですらサポートするようになってきました。 ご多分に漏れずMacOSUTF-8はサポートしており、システムもUTF-8で正規化されています。 しかしながら、UTF-8の中にもUTF8 NFCというものと、UTF-8 NFDというものがあり、濁点、半濁点の扱い方が異なっているようです。 MacOSは後者のUTF-8 NFDで正規化されており、UTF-8-MACと呼ばれているようです。 LinuxやFreeBSDなどはUTF-8 NFCで正規化

    Mac OS 10.8 (Mountain Lion)でNFS領域をマウントする。 - TOYBOX
  • いいから聞け! 俺が文字コードについて教えてやるよ その1(前提知識編) - 谷本 心 in せろ部屋

    ちょっと久々のJavaネタですが、 前から書き溜めていた、文字コードやエンコードについてのノウハウを書きます。 今回は、詳細な説明に入る前に、前提になる知識や用語について説明しておきます。 文字コードとエンコードって違うの? 新人くん「では、HTMLの文字コードはUTF-8でお願いします」 先輩社員「文字コードじゃなくてエンコーディングでしょ?」 新人くん「えっ。あぁ、はい、それで」 文字コードとエンコード(エンコーディング)を混同して使ったりすると、 ちょっと原理主義的な人に怒られたりするんですけど、 大まかに言えば、「文字コード」は文字に割り当てられた「数字」のことで、 「エンコード」は文字と数字をマッピングする「方式」のことだと捉えていれば、大きくは外れません。 ただ、「文字コード」という言葉は、「数字」「方式」の両方で使われるほか、 文字一覧を示す「Charset」という意味で使わ

    いいから聞け! 俺が文字コードについて教えてやるよ その1(前提知識編) - 谷本 心 in せろ部屋
  • 1