タグ

ブックマーク / asuwa.hatenablog.com (1)

  • Javaにおける文字コードまわりの話(2) - あしのあしあと

    Javaにおける文字コードまわりの話 - あしのあしあと」は、もう少しブラッシュアップしたい。その前に、検証用のプログラムを少しだけ整理しておきたい。 ここでは、次のような用語を用いることにする。 文字と文字の識別子の集合を「文字集合」と呼び、文字の識別子を「コードポイント」と呼ぶ。 コードポイントからバイト列(バイト配列)へ変換する処理を「エンコード」と呼び、その逆を「デコード」と呼ぶ。 エンコード、デコードの方法を「エンコード方式」や「文字エンコーディング」と呼ぶ。 Javaでは、文字集合と文字エンコーディングを組み合わせた「エンコーディングセット」という概念が用いられる。「エンコーディングセット」って用語、正直、あまり使わない*1。。 http://java.sun.com/javase/ja/6/docs/ja/technotes/guides/intl/encoding.doc

    Javaにおける文字コードまわりの話(2) - あしのあしあと
  • 1