タグ

htmlとcharsetに関するhasegawayosukeのブックマーク (3)

  • シフトJISを使い続ける上場企業をまとめてみた - megamouthの葬列

    srad.jp こういうニュースがあった。世界のWebサイトの90%がutf-8を使用している、という。 昔、シフトJISでエンコードされたPHPファイルを編集させられた時、「表示」が表示できず(文字通りの意味である)バイナリリテラルを書いていたことを思い出す。 文字コード断絶の歴史を乗り越え、世界はようやくUnicodeの元に集結したのである。 日の上場企業のcharset指定状況 さて、美しいニッポンである我が国はどうであろうか、 www.pathfindergate.com 私は上記のサイトより早速日の上場企業のHPのリストをダウンロードさせていただくと、さらっとクローラーを書いてHTTPヘッダのcharsetとmetaタグのcharset、ついでにDOCTYPE宣言を集計することにした。 というのは実は嘘で、去年の12月頃にクローラーは出来上がっていたのだ。この記事が出る前にと

    シフトJISを使い続ける上場企業をまとめてみた - megamouthの葬列
  • HTML Standard

    4.10.17 Form control infrastructure4.10.17.1 A form control's value4.10.17.2 Mutability4.10.17.3 Association of controls and forms4.10.18 Attributes common to form controls4.10.18.1 Naming form controls: the name attribute4.10.18.2 Submitting element directionality: the dirname attribute4.10.18.3 Limiting user input length: the maxlength attribute4.10.18.4 Setting minimum input length requirements

    hasegawayosuke
    hasegawayosuke 2013/05/27
    <input type="hidden" name="_charset_">でcharsetが送信可能!
  • HTML Standard

    13.2 Parsing HTML documents13.2.1 Overview of the parsing model13.2.2 Parse errors13.2.3 The input byte stream13.2.3.1 Parsing with a known character encoding13.2.3.2 Determining the character encoding13.2.3.3 Character encodings13.2.3.4 Changing the encoding while parsing13.2.3.5 Preprocessing the input stream13.2.4 Parse state13.2.4.1 The insertion mode13.2.4.2 The stack of open elements13.2.4.3

    hasegawayosuke
    hasegawayosuke 2011/12/08
    Determining the character encoding
  • 1