Poppler is a PDF rendering library based on the xpdf-3.0 code base. What's with the name? Contact Discuss poppler on the poppler mailing list, or visit the #poppler irc channel on irc.libera.chat. Download The latest stable release is poppler-24.07.0.tar.xz, released on July 1, 2024: core: * Fix crashes in broken files * Internal code improvements qt6: * Add getters for document additional actions
最近の Linux だと Poppler というライブラリを使用して PDF の処理を行っているようです *1 。Poppler をインストール(Fedora13 だと poppler-utils パッケージ)すると pdftotext というコマンドが付属していて、そのコマンドからテキスト抽出することもできます。たまたま poppler の Python バインディングも Poppler Python Bindings in Launchpad で開発中だと知ったのでインストールして使ってみました。 Fedora13 なら poppler/pypoppler 共に yum からインストールできます。 $ sudo yum -y install poppler poppler-utils poppler-data poppler-glib \ pypoppler $ rpm -q popp
ブラウザでPDFを開くととっても重いんですよ。まぁ、かっこいい人たちはAdobe Readerなんて使わずに Foxit Reader とか軽いの使ってるのかも知れないんだけど。 ともかく、http://finance.firstlife.jp/を自分で使ってて、重いAcrobat Readerを何度も開くのは嫌になってきたので、サーバー上で変換かけれないのか、ってとこを調べてみました。 さて、何が使えるかな。Xpdfあたりかな、なんて思ってたら知らない間にForkして、Popplerってのが出来てるらしい。で、その中にpdftohtmlってコマンドがあって、それで実現できそう。 今回インストールしたサーバーのOSはFreeBSD、サクラインターネットなんだけどね。SSHとか解放してくれてるのが有り難いです。自前のサーバーとかroot権限があるところなら、パッケージでインストールするのが
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く