とりあえず windows 用ですが、EXEPATH, OPTIONS を書き換えると linux でも動くはず。 pdftotext は読み取った値を標準出力に出力できないため、一旦ファイルに書き出してから取得しています。 pdftotext.rb require 'digest/sha1' module PdfToText EXEPATH = 'C:/Program Files/xpdf-3.02pl2-win32/pdftotext.exe' OPTIONS = ' -enc Shift-JIS' def self.execute(path=nil) tmp_path = get_temp_file_path(path) system("#{EXEPATH} #{OPTIONS} #{path} #{tmp_path}") text = nil if File.exist?(tmp_