本日のメニュー 大量の英文pdfファイルを読みたいのだけれど、英単語がそもそもわからない。 ひとまずpdfファイルをtextファイルに変換して、単語をリスト化して、頻出単語を上から順番に暗記しよう。きっとその方が早く読める!と信じることにした。 そういうわけで、大量の英文pdfファイルを鍋に投入し、茹でてtextファイルに変換することにした。 気分はさながら椀子そば大会のために大量のそばを茹でる気分。 調理台の環境 macOS Python3.6 anaconda 食材 消化に困る大量のpdfファイル 調理器具 pdfminer ←インストール方法末尾の参照URLをチェック os re PyPDF2よりも、pdfminerの方が良い結果を得られる、らしい。 調理の失敗として想定されること 日本語の文章には対応していない(と思われる)ので、ご留意ください。 今日の鍋 #! python3 #