PDFファイルからテキストを抽出するには、pdftotextコマンドを使用する。pdftotextコマンドは、Xpdf(http://www.foolabs.com/xpdf/)に含まれている。Fedora Core 3(FC3)にはXpdfのパッケージが用意されており、 > このページを見る
最終更新時間:
2005年06月01日21時17分
みんなのブックマーク 人気(0) 新着
- html
- ubuntuではxpdf-utilsパッケージ(あるいは排他利用でpoppler-utilsパッケージ)に入ってるそうな。
- sudo apt-get install xpdf-reader の後に、/etc/xpdfrc の #textEncoding UTF-8 をコメントアウト。その後、pdftotext sample.pdf sample.txt
- pdftotext
- pdftotext。Xpdf。
- Xpdf の pdftotext コマンド
- PDFtoTEXT
- pdftotext








