Requestsを使ってサイトにアクセスした際、サイトによってはエンコード情報を適切に判定してくれない場合があるようです。例えば下記のような場合、 SHIFT_JIS が欲しいところで ISO-8859-1 が返ってきます。 In [1]: import requests In [2]: r = requests.get("http://www.atmarkit.co.jp/") In [3]: r.encoding Out[3]: 'ISO-8859-1' このブログにアクセスした場合はこのようになります。これは正しく返してくれます。 In [4]: r = requests.get("http://blog.aoshiman.org") In [5]: r.encoding Out[5]: 'utf-8' ちゃんと調べてはいないのですが、レスポンスヘッダに文字コード情報が入っていない場