環境はMacOSX, homebrewです。 homebrewでxpdfをインストールする。 $ brew install xpdf 動作確認。 $ pdftotext hoge.pdf 日本語が含まれる場合、このようなエラーが出る。 Error: Unknown character collection 'Adobe-Japan1' 調べてみると日本語用の設定が必要なようだ。 xpdfのサイトからLanguage Support Packagesの xpdf-japanese.tar.gz をダウンロード。 解凍したものを /usr/local/share/xpdf/japanese に配置する。 /usr/local/etc/xpdfrc に add-to-xpdfrc の内容を追記する。 ここまでだと、エラーはなくなるが、日本語が読み飛ばされる。textEncoding設定のコメント