Word,PowerPoint,PDFなどに埋め込まれた情報(テキスト)を抽出できる「textract」のインストールについて解説しています。 「textract(https://github.com/deanmalmgren/textract)」は、Word,PowerPoint,PDFなどの各形式から、無関係なマークアップなしでコンテンツを抽出できるPythonライブラリです。 ■Python 今回のPythonのバージョンは、「3.8.5」を使用しています。(Windows10)(pythonランチャーでの確認) ■textractをインストールするtextractをインストールを行いますが、今回はpipを経由してインストールを行うので、まずWindowsのコマンドプロンプトを起動します。 pip install textract起動後、上記のコマンドを入力し、Enterキーを押しま