タグ

HTTPとhtmlに関するwushiのブックマーク (1)

  • HTML Document Representation (ja)

    この章では、HTML文書がコンピュータ内部やインターネット上でどのように表現されるかを記す。 文書文字集合の節では、どんな抽象文字がHTML文書を構成し得るかという話題を示す。ここで扱う文字には、ラテン文字の「A」やキリル文字の「И」、漢字の「水」などが含まれる。 文字符号化方法の節では、これらの文字が、ファイル中にある際やインターネット上を転送される際にどのように表現されるかという話題を示す。文字符号化方法の中には、著者が文書に含めたい文字のすべてを直接表現できないようなものもあるため、HTMLでは文字符号化方法とは異なる文字参照という機構を用いてあらゆる文字を参照できるようになっている。 人類の言語全体では膨大な数の文字が存在し、この文字を表現する方法も非常に多様であるため、世界中のユーザエージェントが文書を理解できるよう、細心の注意を払う必要がある。 5.1 文書文字集合 相互運用性

    wushi
    wushi 2011/06/15
    5.2.2 文字符号化方法の指定に文字コード指定の優先順位の記述がある
  • 1