
エントリーの編集

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
Wordファイルからgrepのように抽出する - Qiita
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
Wordファイルからgrepのように抽出する - Qiita
概要 Word(docx)ファイルから、指定の単語を含む行(パラグラフ)を抜き出して列挙します。 単にWordの... 概要 Word(docx)ファイルから、指定の単語を含む行(パラグラフ)を抜き出して列挙します。 単にWordの機能で検索するよりは、ある単語がどういうところで使われているか、をまとめて取り出すのに便利かと思います。 cf. python wordgrep.py -f "path/filename.docx" -w "ほげほげ" 単語の指定には、正規表現が使えます。 PyInstaller で、windows 用実行ファイルを作成してあります(Windows10 検証済み) 仕組み 基本的な仕組みは簡単で、python-docx でWordファイルを読み込むと、1パラグラフごとに取得できるので、それを配列に入れて、その配列を正規表現でフィルタ(match)させるだけです。 コード コマンドラインからの引数の設定など from docx import Document import sys