タグ

OSSとPDFに関するidoyaのブックマーク (2)

  • PHPでWordのdocファイルやPDFをテキストとして読み取る方法:phpspot開発日誌

    Read PDF and Word DOC Files Using PHP PHPでWordのdocファイルやPDFをテキストとして読み取る方法が紹介されていました。 XPDF package、Antiword というプログラムをshell_execで外部起動するだけなのですが、WordやPDF用の検索のインデックスを作成する時など、なかなかこれは便利そうです。 PDFの場合は、XPDFパッケージをインストールして入るコマンドのpdftotext にファイル名を渡します。最後の - も必要みたい。 $content = shell_exec('/usr/local/bin/pdftotext '.$filename.' -'); //dash at the end to output content これで $content にpdfのテキストが入る Wordの場合も同様に、Antiwor

    idoya
    idoya 2009/01/05
    PHPでWordのdocファイルやPDFをテキストとして読み取る方法
  • MOONGIFT: PHPとOpenOfficeを連携「Puno」:オープンソースを毎日紹介

    Web上でオフィスドキュメントを生成して欲しい、という要望を受けたことはないだろうか。大抵、CSVファイル出力で逃げたり、PDFを生成したりという手を使うが、今後を考えると抜的な解決をしたいところだ。 そこで使ったみたいのがオープンソースなオフィススイート、OpenOfficeだ。 今回紹介するオープンソース・ソフトウェアはPuno、PHPとOpenOfficeを連携させるソフトウェアだ。 PunoはPHPの拡張ライブラリとして提供される。プログラム側でOpenOfficeのオブジェクトを呼び出し、文字を打ち、出力することができる。 PDFへのエクスポートが使えるので、同様の操作でMS Officeに対応した出力もできるだろう。PHPによるExcel操作などのライブラリも存在するが、一括して取り組むならOpenOfficeを使ってドキュメント、表計算、プレゼンテーション、ドローとあらゆる

    MOONGIFT: PHPとOpenOfficeを連携「Puno」:オープンソースを毎日紹介
  • 1