タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

html5とcharacterencodingに関するkitsのブックマーク (3)

  • いつか来た道「HTML5ではShift_JISをWindows-31Jだと解釈する」 | inquisitor

    拙著『Webアプリケーション構築入門』にも書きましたが、HTML5では、以下のような記述で文書の文字コードを指定します。 <meta charset="文字コード" /> 面白いことに、HTML5では、 <meta charset="Shift_JIS" /> と書いても、 <meta charset="Windows-31J" /> と書いたと見なされるらしいのです(HTML Living Standard)。 文字コードとしてのShift_JISとWindows-31Jの間には、さまざまな違いがありますが、私にとって最も重要なのは、0x5Cの扱いです。 Shift_JISの0x5Cは円記号です。IANAによれば、Shift_JISはJIS X 0208で規定されていて、JIS X 0208にはビット組み合わせ21~7Eの1バイト符号の領域には、JIS X 0201のラテン文字用図形文字

  • HTML5の文字セットと己言語識別子 - 日本語練習虫

    HTML5の文書文字セット(document character set)はどんな符号化文字集合(coded character set, CSS)なんだべか、HTML5だからUnicode5だったりするんだべか、てなことが知りたくてドラフトば眺めてみだっけ、それらしい記述が探せねがった。出てきたのは、文字エンコーディングスキーム(character encoding scheme, CES)についてXHTMLぢゃないHTMLだったら最初のmeta要素のcharset属性で示すべしといふ件(<meta charset="shift_jis">てな新しい記法)のみ。 ひょっとしてコメントアウトされた隠しメッセージがあったりしねぇべかと文書のソースば眺めてゐだっけ、ルート要素のlang属性が「en-US-x-Hixie」と記されったことに気づいた。HTML5のドラフトは、Ian "Hixie"

    HTML5の文字セットと己言語識別子 - 日本語練習虫
    kits
    kits 2008/01/25
    SGMLでないのでSGML宣言もなく、文字集合も不明ということか。/ XML構文との互換性をとるなら ISO/IEC 10646 ということでいいのかな。
  • Untitled

    Database Not Connected. Please setup the database. No SETUP directory found.

    kits
    kits 2008/01/24
    UTF-7, DOMImplementation.hasFeature("HTML", "5.0")
  • 1