pdftotext(Windows で使う) pdfファイルからテキスト文字列を抽出するツールとして、pdftotext があります。 Xpdf という pdf を X Window 上で表示すのツールの配布物の一部として、UNIX 派生の OS の場合は、Xpdfのダウンロードサイトから最新のものをダウンロードして指示に従ってインストールすれば良いでしょう。 日本語サポートパッケージ ftp://ftp.foolabs.com/pub/xpdf/xpdf-japanese.tar.gz をインストールすることを忘れなければ問題ないと思います。 日本語でのインストールの手順の解説では、 http://october.servehttp.com/pdftotext.htm があります。 (・・・といっても、私はやったことがありません。) Windows では、Xpdfのツールの中の一部(p