タグ

Perlとpdfに関するmasasuzのブックマーク (2)

  • わいえむねっと - 2011/04/03

    オライリー自身が提供してくれていたので利用してみました。 スクリプト 例によって Perl です。 use strict; use warnings; use Crypt::RC4; use Digest::MD5; use Encode; use JSON; use LWP::UserAgent; undef $/; my $pass = ''; my $url = 'http://www.oreilly.co.jp/books/%s/biblio.json'; my $ua = LWP::UserAgent->new; while(<*.pdf>) { next unless /-(\d{13})/; my $bookinfo = get_bookinfo($1); open my $in, $_ or die; open my $out, '>', $bookinfo->{title

  • わいえむねっと - 2011/03/30

    オライリーのebookから余白を除去して、Kindleで快適に読む方法 - ただのにっき(2011-03-28) http://sho.tdiary​.net/20110328.h​tml#p01 電子書籍端末向けにPDFを加工するには、テキストデータを抽出する方法や、PDFをそのまま加工(crop)する方法があるが、オライリーのPDFはDRMがかかっているのでいずれもうまくいかないようだ。 歯を磨きながら Ebook のバイナリをぼけと眺めてみたのですが、CropBox の書き換えは特に問題なさそうな気がしたので試してみました。 スクリプト 例によって Perl で。 use strict; use warnings; # left, bottom, right, top my @offset = (20, 20, -20, -20); while(<*.pdf>) { next if

  • 1