タグ

charsetとcharacterに関するpsychedesireのブックマーク (3)

  • UTF-8の冗長なエンコードとは何で、なんでそれがセキュリティ的に危ないのか?を文字コード知識レヴェル3くらいの凡プログラマが考えてみる - tohokuaikiのチラシの裏

    何故かあたり前にならない文字エンコーディングバリデーション | yohgaki's blog ってあるように、いまいち文字コードの不正な判定による危険性ってのが分かってない。 SJISの問題は、(2/3)SQLインジェクションを根絶!セキュア開発の極意 - 第5回■注目される文字コードのセキュリティ問題:ITproの記事がわかりやすかった。 というか、やっぱりPHP使ってると誰でも一度は「なんじゃこの『¥』は?」って思うもんなんで。 なるほど、確かに↓の図のように「あるバイト」が2つの意味を持つっていう文字コード形態はやばいんだなと。 EUC-JPはそんなことはしないで、1つのバイトには1つの意味しか取らせない。 だけど、これでも文字化けが起こることがある。経験的には、「マルチバイトをXX文字で切り落としたい」とかやった場合。ちゃんと文字コードを判定してくれるPHPでいえばmb_subst

    psychedesire
    psychedesire 2009/09/11
    『要するに、「3バイト食いますよ~」っていうフラグを立てておきながら(つまり1100000のバイトを送る)、2バイトしか送らなかった場合、次の文字も巻き込んでしまうんじゃないかってことかな?これって、EUC-JPやSJISで
  • 第7回 Unicodeからの多対一の変換[前編] | gihyo.jp

    文字コードが引き起こすセキュリティ上の問題として、もっとも興味深いもののひとつである、Unicodeから他の文字コードへの「多対一の変換」で引き起こされる問題点について、今回と次回で説明します。 ご存じのとおり、Unicodeには非常に多数の文字が収録されていますが(現在最新版のUnicode 5.1.0では100,713文字が収録されているそうです⁠)⁠、Unicodeから他の文字コードへの変換においては、互換性や可読性の維持のためか、複数のUnicodeの文字が他の文字コードでは単一の文字に変換されることがあります。 この「多対一」の変換が、開発者も想定していなかったような問題を引き起こす原因となることが多々あります。 具体的な例として、Windows上でのUnicodeからの変換について説明します。 Windows上でのUnicodeからShift_JISへの変換 Windows上で

    第7回 Unicodeからの多対一の変換[前編] | gihyo.jp
  • 「Little Dieter Needs to Fly」鑑賞 – KingInK

    こないだやっと劇場公開されたヴェルナー・ヘルツォークの映画「RESCUE DAWN」のもととなった、ヘルツォーク自身によるドキュメンタリー「Little Dieter Needs to Fly」を鑑賞。 これはディーター・デングラーというドイツ生まれのアメリカ人に関する作品で、子供の頃に目撃した飛行機の素晴らしさにとりつかれたディーターは18歳のときに単身アメリカへと渡り、夜学で勉強しながら大学を出て空軍に入り、念願のパイロットとなる。しかし折しもアメリカはベトナム戦争に突入しており、ディーターも戦地へ向かわされて戦闘機に乗るが、ベトナム軍に撃墜されて捕虜になってしまう。そこで地獄のような拷問を半年にわたって受け続けた彼は、ある日ほかの捕虜たちと脱走を決行する…。というのがおおまかなプロット。 いちおう戦争ドキュメンタリーなんだけど、むしろ空を飛ぶという夢にとりつかれたディーターの姿に話の

    psychedesire
    psychedesire 2009/07/14
    ソース見たらわかる。へぇ~。
  • 1