2008年09月(7) 2008年08月(24) 2008年07月(36) 2008年06月(42) 2008年05月(13) 2008年04月(16) 2008年03月(8) 2008年02月(13) 2008年01月(26) 2007年12月(19) 2007年11月(14) 2007年10月(1) 2007年09月(11) 2007年08月(18) 2007年07月(14) 2007年06月(23) 2007... 続きを読む
ref:Open ブログ: ◆ シフトJIS と unicodevia:Matzにっき(2007-03-12)初めにお断りしておくが、本項は、誰かを批判することが目的ではない。素人にありがちな誤解を正すことにある。 上記のサイトで、素人が間違いを犯しているからといって、素人を批判するつ... 続きを読む
RedHatの技術者であり、Debian開発者でもあるtagoh氏のblogに「 UTF-8は十分かどうか」という書き込みがある。 これは、「 シフトJISを捨てられるか?」というITproの記事に対して、Ruby開発者のMatz氏が 「『短いに越したことはない』というごく弱い理由で、さ... 続きを読む
yamaokaです。 PHPで日本語を扱う場合、mbstringモジュールを利用する場合が多いと思います。 日本語に特有の機能(カタカナの全角/半角変換など)も備わっていて、とても便利です。 しかし、日本以外ではmbstringモジュールはあまり利用されていないようです。... 続きを読む
基本的に、まともな国際化ライブラリを使っていれば、上記のような不正な文字コードはきちんと処理してくれるはずです。実際、 Opera, Firefox, IE ともに適切にエスケープしてくれました。また、 UCS に変換した後にエスケープ処理を行うことでも対処できるか... 続きを読む
UTF-7 を使ってスクリプトを記述 +ADw-SCRIPT+AD4-alert(\'XSS\');+ADw-+AC8-SCRIPT+AD4- IE は、文字エンコーディングが不明で UTF-7 っぽい文字列があれば、自動判別で UTF-7 となる。 続きを読む