タグ

ブックマーク / yumimue.hatenadiary.org (1)

  • バイト文字列とUnicode文字列 - ひきメモ

    Pythonの文字列にはバイト文字列とUnicode文字列の二種類があります。 print "ぱいそん" # バイト文字列 => ぱいそん print u"ぱいそん" # Unicode文字列 => ぱいそん バイト文字列 バイト文字列はいわゆる普通の文字列で、指定された文字エンコーディングに従って変換されたバイト列です。ですから、同じ文字列でも文字エンコーディングが違うと、出力される結果は同じでも、内部的には違うデータです。 # encoding=shift_jis str = "ぱいそん" print str #=> ぱいそん print [str] #=> ['\x82\xcf\x82\xa2\x82\xbb\x82\xf1'] # encoding=iso-2022-jp str = "ぱいそん" print str #=> ぱいそん print [str] #=> ['\x1b$

    バイト文字列とUnicode文字列 - ひきメモ
  • 1