tree3yamaのブックマーク / 2009年5月23日 - はてなブックマーク

tree3yama id:tree3yama

2009年5月23日のブックマーク (1件)

第4回　UTF-8の冗長なエンコード | gihyo.jp
今回は、文字コードに関連するセキュリティの話題では古参ともいえるUTF-8の冗長なエンコードというテーマについて紹介します。 UTF-8とは UTF-8は、各文字を1～4バイトの可変長で表現するUnicodeの符号化方式のひとつです。 U＋0000からU＋007Fの範囲の文字を0x00から0x7Fの1バイトで表現しているため、US-ASCIIと互換性がある、バイト列の途中からでも文字の先頭バイトを簡単に検出できる、多バイト文字の途中に0x00や0x5C（\⁠）⁠、0x2F（/）などが現れない、などの特徴があります。 UTF-8での文字のビットパターンは表1のようになります。表1　UTF-8でのビットパターン
tree3yama 2009/05/23
EUC-JP の声(C0 BC)、西(C0 BE)、成(C0 AE)、政(C0 AF) あたりを覚えていると、CVE-2007-0242 とか CVE-2008-2938 とかの検証は簡単に出来る。
リンク
- 2009年5月25日
- 2009年5月23日
- 2009年5月20日

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx