タグ

2011年1月4日のブックマーク (2件)

  • UnicodeとUTF-8の違いは? - Humanity

    という2chのスレがかなり勉強になったのでまとめ。 少しでも有用だと思ったものは載せてあるので結構長いです。 Unicodeのような文字集合(符号化文字集合?)やUTF-8のようなエンコーディング方式に限らず色んな文字コードにまつわる話があります。 たびたび話が繰り替えされますがそれは確認ということで。 (元スレ) 追記:簡単にまとめました。 1 :デフォルトの名無しさん:2007/04/30(月) 20:02:37 ビッグインディアンとかなんとかかんとか 3 :デフォルトの名無しさん:2007/04/30(月) 20:05:48 また、頭の悪そうなスレが・・・ >>1 それは魚とマグロの違いを訊ねるようなもんだ。 4 :デフォルトの名無しさん:2007/04/30(月) 20:06:49 魚と鮪というよりは、魚と刺身の違いのような気がする。 5 :デフォルトの名無しさん:2007/04/

    UnicodeとUTF-8の違いは? - Humanity
  • UnicodeDecodeError: 'utf8' codec can't decode byte 0x82 in position 0: unexpected code byte - peroon's diary

    #hoge.pyの文字コード設定は1行目でutf-8を指定しているかと思います。 #そしてユニコード文字列を宣言した後、utf-8に変換しようとしたとき、 #上記のエラーが出ることがあります。 s=u'ああああ' t=s.encode('utf8') #=>error.. #原因は、ソースコードがSHIFT-JISで書かれていたからでした。 #(n fact, code is not UTF-8 but SHIFT-JIS ..) #vimであれば #set: fenc=utf-8 #とすれば、エラーは解決するはずです。

    UnicodeDecodeError: 'utf8' codec can't decode byte 0x82 in position 0: unexpected code byte - peroon's diary