pythonで文字コードを判定するには普通kconvとかpykfとかchardetを使う。 何かの本(たしか「みんなのPython」だったと思う)を以前立ち読みをしてたら文字コードを判定するのに、適当なエンコーディングでUnicodeに変換してみてUnicodeErrorが発生しないかどうか確かめるという恐ろしい方法が紹介されていた。具体的にはこんなコードになるか(うろ覚え)。 encodings = ('shift_jis', 'euc-jp', 'utf-8', 'iso2022_jp') def chardetect(data): for enc in encodings: try: unicode(data, enc) except UnicodeError: continue return enc return None 数日前にこのコードを使ってみることがあったのだがそう悪くな