タグ

ブックマーク / kazusa-pg.com (1)

  • 【Python】テキストファイルの文字コードを判別してファイルを開く

    Pythonのopenで使用するencodingはプラットフォームに依存します。 Windowsであればcp932です。 Windows上のUTF-8で保存されたテキストファイルをencoding引数に何もつけずにopenするとエラーが発生します。 1with open('UTF-8.txt') as f: 2 s = f.read() 3 print(s) # UnicodeDecodeError: 'cp932' codec can't decodeが発生する テキストファイルを開く前に文字コードを判別してから適切なencoding引数で開くようにしてみます。 chardetを使用して文字コードを判別する chardetを使用して、文字コードを判別します。 https://pypi.org/project/chardet/ pipを使用してchardetをインストールします。

    【Python】テキストファイルの文字コードを判別してファイルを開く
    reboot_in
    reboot_in 2023/01/24
    “with open('Shift-JIS.txt', 'rb') as f: print('Shift-JIS.txt') print(chardet.detect(f.read()))))”
  • 1