タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

Rubyとpdfに関するtatakinakoのブックマーク (1)

  • 業務システムで使える。PDFファイルからテキストや画像を抜き出せる·PDF::Reader MOONGIFT

    PDF::ReaderはPDFファイルの操作を行うRubyライブラリ。 PDF::ReaderはRuby製のオープンソース・ソフトウェア。PDFというドキュメントフォーマットはビジネスの場において数多く使われている。WebサービスPDFによる帳票出力やエクスポートをサポートしているものが多い。 画像の抜き出し処理 閲覧や印刷する分には申し分ないフォーマットなのだが、システムに取り込んで加工しようと思うととたんに面倒なフォーマットになる。そのためのライブラリ(PDFtoHTMLなど)もあるが、もっとシステムから扱いやすくしてくれそうなのがPDF::Readerだ。 PDF::ReaderはRubygemsを使ってインストールするライブラリだ。機能は数多くあるが、例えばメタデータを抜き出したり、テキスト情報を取り出す、画像だけを取り出す、ページを数えるといったPDF操作を行えるライブラリにな

  • 1