UTF-8の冗長なエンコードとは何で、なんでそれがセキュリティ的に危ないのか?を文字コード知識レヴェル3くらいの凡プログラマが考えてみる @ それ図解で。・・・tohokuaikiのチラシの裏 これを読んで、ちゃんと疑問に持ったことを検証したりするのって凄いなとか、自分は文字コードってかなりなんとなくでしかわかっていないな、と思いこれがレベル3であればそれを埋めるための知識をちゃんと理解しようと勉強しつつエントリをまとめてみました。 ってことで、文字コードを理解するに当たって現状はというと、 ・ 文字コードってメジャーどころだとEUC-JPとかShift-JISとかUTF-8とか色々あるよね ・ その当たりのコード変換すると理由はよくわからないけど文字化けすることあるよね ・ 文字コード表ってよく見るけどマトリックス表に漢字とかが埋められてて、それが文字コードごとに違うんだよね ってぐらい