Read PDF and Word DOC Files Using PHP PHPでWordのdocファイルやPDFをテキストとして読み取る方法が紹介されていました。 XPDF package、Antiword というプログラムをshell_execで外部起動するだけなのですが、WordやPDF用の検索のインデックスを作成する時など、なかなかこれは便利そうです。 PDFの場合は、XPDFパッケージをインストールして入るコマンドのpdftotext にファイル名を渡します。最後の - も必要みたい。 $content = shell_exec('/usr/local/bin/pdftotext '.$filename.' -'); //dash at the end to output content これで $content にpdfのテキストが入る Wordの場合も同様に、Antiwor