エントリーの編集
![loading...](https://b.st-hatena.com/bdefb8944296a0957e54cebcfefc25c4dcff9f5f/images/v4/public/common/loading@2x.gif)
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
ファイルの文字列を抽出したいからpythonツールを作ってみた(PPT&Excel編)
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
![アプリのスクリーンショット](https://b.st-hatena.com/bdefb8944296a0957e54cebcfefc25c4dcff9f5f/images/v4/public/entry/app-screenshot.png)
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
ファイルの文字列を抽出したいからpythonツールを作ってみた(PPT&Excel編)
はじめに 自然言語処理のAI案件に関わっていると、ファイルに記述されている文字列を抽出して利用したい... はじめに 自然言語処理のAI案件に関わっていると、ファイルに記述されている文字列を抽出して利用したい時があります。ファイル数や文字列の量が少なければ手動でコピペをすれば良いのですが、大量に扱う時は、堪ったものではありません。そんな時は、ツールを使えば簡単に短時間でファイル中の全文字列を抽出することが出来ます。今回はPPT&Excelの文字抽出ツールをご紹介します。 PPTツールについて サンプルコード PPTの文字抽出は、pptxパッケージのPresentationsを使います。 サンプルコードはこちらになります。 # PowerPoint from pptx import Presentation def get_all_text(filepath: str): presentation = Presentation(filepath) results = [] for slide in