はじめに JavaでPDFを操作するライブラリの中で,「PDFBox」に触れてみる 特長は PDFファイルからのテキストの抽出 PDFファイルの結合 PDFファイルの暗号・複合化 検索エンジン Lucene の組み込み FDFデータの埋め込み イメージをPDFに変換 PDFからのイメージ取得 など 準備 Apache PDFBox - Download からダウンロード ※今回は,「pdfbox-1.4.0.jar」 使ってみる PDFファイルの読み込み FileInputStream pdfStream = new FileInputStream(readFile); PDFParser pdfParser = new PDFParser(pdfStream); pdfParser.parse(); // 分析 PDDocument pdf = pdfParser.getPDDocume