はじめに Python3で、'\udc82Ђ\udce7\udc83J\udc83^\udc8a\udcbf\udc8e\udc9a'のように、化けて出力されてしまった文字列を、なんとかして正しく表示させようという試みです。 参考 Unicode HOWTO 標準エンコーディング Shift_JISのバイト列をUTF-8デコードしてしまったとき デフォルトではUnicodeDecodeError Shift_JISのバイト列をデコード(デフォルトではUTF-8)しようとすると、UnicodeDecodeErrorが発生します >>> bytes_sjis = "ひらカタ漢字".encode("shift_jis") >>> bytes_sjis b'\x82\xd0\x82\xe7\x83J\x83^\x8a\xbf\x8e\x9a' >>> bytes_sjis.decode() Tra