charsetに関する注意書き (1998年11月30日、β1公開。12月6日、β2公開。12月12日、β3公開。1999年1月9日、β4公開。4月1日、特に直すところが思い付かないので、正規版にしちゃうことにした。) (W3C XML WGメンバーである村田真氏の要請にこたえる形で書いた文書です。) /日本語エンコード方式の種類/ 日本語エンコード(日本語テキストデータのための符号化形式)の代表は、1998年現在のところ、iso-2022-jp(俗にJISと呼ばれる)、euc-jp(extended unix code)、Shift_JIS(俗にMS漢字コードと呼ばれる)です。 (注:「俗」はあくまで「俗」であって、正しくないようです。たとえば、厳密にはMS漢字コードはShift_JISの上位互換エンコード方式で、NEC拡張とIBM拡張を含むものだそうです。charset名もwindow