タグ

文字コードに関するimaclのブックマーク (2)

  • 使えない文字

    #PCDATA #PCDATA(parsed character data)は解析の対象になるので、「<」, 「>」はそれぞれタグの開始, 終了と解釈されてしまいます。よって、直接記すのではなく文字を参照しなければならなりません。&は文字実体参照の開始記号として使われるので、それ以外の用途なら文字を参照します。HTML 4では1114111までISO 10646の文字コード位置で参照可能ですが、HTML 3.2は255までです。一覧表 ※HTML 4では10進数だけでなく16進数でも良いことになってはいますが、10進数の方が無難です。実体参照では大文字小文字が区別されます。 < → < (<) > → > (>) & → & (&) Å → Å (Å) å → å (å) CDATA CDATA(character data) は、文字データの終りを示す区切り子「</」の他にはマーク

  • MOYO Laboratory ブラウザの文字コード誤認識対策

    サーブレットによる Web 開発において日語 (Shift_JIS コード) の文字化けはポピュラーな話題の一つである。サーバ側での文字化けについてはサーブレットの基としてあちこちで紹介されているので改めて述べる必要もないだろう。あれらは再現性があり試行錯誤もできる。 しかし、ブラウザの文字エンコーディング誤認識は偶発的で再現性がなく、それどころかしばしば問題そのものがサーバ側の文字化けと混同されている事がある。不適切な方法を紹介しているサイトも最近目に付くのでここで正しておこうと思う。 なお、ここで記述している 「ブラウザ」 とは主に Internet Explorer の事であり、全てのブラウザを意味しているわけではない。 JSP の中で文字エンコーディングを指示する場所は 3 つある。それぞれ用途や目的が異なっているので、まずはそれらを整理しよう。 <%@ page langua

    MOYO Laboratory ブラウザの文字コード誤認識対策
  • 1