概要 Office内のテキストをgrepする必要があり、エクセル、ワード、パワーポイントからテキストを抽出するツールを作成したので作り方も踏まえて紹介します。 JavaのPOIでもいいのですが、簡単に作ることができるのでC#で作りました。 .Net Framework 4.5.1(コマンドラインのパースライブラリが必須のため。これを使わなければもっと古いバージョンでも動作可能と思われます)、Officeのインストールが必須です。 ソース:https://github.com/tashxii/office-extract-text 実行ファイル:https://github.com/tashxii/office-extract-text/releases/download/1.0/OfficeExtractText.exe.zip 特徴 コンソールアプリケーションなので、バッチなどで抽出する