エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
Perl で PDF ファイルを分割、テキスト抽出する
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
Perl で PDF ファイルを分割、テキスト抽出する
Perl で さくっと PDF ファイルを分割、テキスト抽出する方法が無いかなあ?というざっくり調査の結果を... Perl で さくっと PDF ファイルを分割、テキスト抽出する方法が無いかなあ?というざっくり調査の結果を紹介します。 CPAN モジュールを探したのだが、結論から言うとどれも一長一短でした。 PDF::Extract http://search.cpan.org/~nsharrock/PDF-Extract-3.03/ その名の通り、指定ページをPDFから抽出するだけのシンプルモジュール。 PDF::Extract でページ分割 use PDF::Extract; my $pdf = new PDF::Extract( PDFDoc=>’mypdf.pdf’ ); my $pageno=5; #$pageno=$pdf->getVars(“PDFPageCount”); #これで取れるはず?だがうまくいかない my $i=1; #2ページずつPDFファイル分割 while($i <=$