urllib2.urlopen を使って Shift_JIS でコーディングされたサイトに機種依存文字が含まれていると上手くエンコード出来ない。 凄く嵌って、漸く解決したので覚書。 #!/usr/bin/env python # vim: set fileencoding=utf-8 : import urllib2 url = ‘http://hoge.hogehoge.com’ html = urllib2.urlopen(url).read() html = html.encode(’utf-8′)