セキュリティがかかってなくてテキストが埋め込まれているPDF群からテキストを一括して抜き出す(Windows - Cygwin編) はじめに Windows - Cygwin編、としているのは、単に、OSとしてUnix系をなんとかするという大仕事をせずに、Windowsからあまり離れずになんとかしよう、という目論見です。Macなら多分、ターミナルを使えばすぐにできることではないかと思います。 なぜわざわざUnix系コマンドを使うことを奨励するかと言いますと、Unix系コマンドは、テキスト処理のコマンドが豊富だから、ということがあります。字数をカウントしたり、行数をカウントしたり、ちょっとしたテキスト検索をしたり…と、色々なコマンドが用意されていて、ググれば色々な処理方法が見つかります。本当はVMware PlayerをインストールしてLinux (CentOSかUbuntuなど)をインスト