タグ

ブックマーク / www.shtml.jp (2)

  • ウェブマスターのための文字化け講座

    (序論)文字化けの発生メカニズム概論と解析方法 ネスケ4.Xで特定の文字(試・時・事・私など)が文字化けする場合 → document.writeで文字化けする漢字の規則性 → ネットスケープ4.Xのキャッシュ機構 → 2種類の解決方法 CGIで特定の文字(表・予・申・能・ソ・十など)が文字化けする → Shift_JISでCGIを作成する場合の注意点 → PHPで「表\示」「十\和田湖」「申\し込み」などと表示される場合 「(はしご高)」が使えない理由 → Windowsでは表示されるが、Macでは文字化けする文字 → Macでは表示されるが、Windowsでは文字化けする文字 → 機種依存文字チェック・プログラム(Flashフォームなど) 文字化けしないための工夫 → メタタグの指定は有効か? → 「美乳」で文字化けが直るって当? フォントを指定したら文字化けした。 → フォントの指

  • 文字コードとセキュリティ(クロスサイトスクリプティングなど)

    では、このHTMLタグの無効化(サニタイジング)はどうすればいいかといいますと、皆さんご存知のように、左の表のように置換すれば良いことになります。これは、下記のような文字化け を悪用した攻撃にも効果的です。 例えば、「<」は16進文字コードで「0x3C」です。確かに、「<」で表示される文字(1バイト)なら、Shift_JISでもEUC-JPでもJISでも文字コードは一緒でしょう。しかし、もし「0x3C」を2バイト文字(漢字)の一部であると解釈すればどうでしょうか? Shift_JISやEUC-JPには幸い「0x3C」は現れませんが、JISには現れます。 例えば、「紗」という漢字は、Shift_JISでは0x8ED1ですが、JISでは0x3C53です。0x3C53は、Shift_JISやEUC-JPでは、「1バイト文字が二つある」としか解釈できまず、この場合、「0x3C=<」「0x53=S」

  • 1