PDF.js A general-purpose, web standards-based platform for parsing and rendering PDFs. Download Demo GitHub Project
米Googleが、Webブラウザ「Chrome」で提供するPDFレンダリングエンジン「PDFium」をオープンソースソフトウェアとして公開した。Google Codeのプロジェクトページより入手できる。 PDFiumは、Chromeに組み込まれているPDFレンダリングエンジン。C++で実装されており、Googleのプラグインアーキテクチャである「Pepper-Plugin-API(PPAPI)」を利用してChrome上で動作する。Googleは約3年前より、ChromeにPDFビューアを統合している。ライセンスは修正BSDライセンス。 なお、Mozillaは「Firefox」のPDFビューアとしてJavaScriptで作成されたpdf.jsを利用している。 pdfim https://code.google.com/p/pdfium/
pdf2htmlEXはレイアウトの再現性を極めたPDFからHTMLへの変換ソフトウェアです。 PDFはそのままでは容易に編集できないフォーマットです。そこが利点でもあり欠点でもあります。PDFを別フォーマットに変換するソフトウェアは幾つかありますが、今回は驚いてしまうくらい品質高いHTML変換を行うpdf2htmlEXを紹介します。 これがHTMLだと思えないくらいの再現度です。 計算式にも対応。 段組み、画像埋め込みも問題なし。 白黒に限らず扱えます。 中国語。マルチバイト対応です。 まるで素のPDFを表示しているかのような再現度の高さがpdf2htmlEXの売りです。PDFを一つのHTMLファイルとして出力し、色や文字の装飾も反映します。リンクもそのまま使えます。なお、Type3のフォントには対応しておらず、テキスト以外のオブジェクトは画像としてレンダリングされるようになっています。
ThinReportsはマルチプラットフォームで動作するエディタを含んだPDF出力の帳票作成ソフトウェアです。 Webシステムで帳票周りに悩まれている方に朗報です。ThinReportsは日本製、かつGUIのエディタまで含めた帳票ソフトウェアになります。 エディタです。Windows/Mac OSX/Linux版があります。 新しい帳票を作成します。 テキストボックスを配置してプログラムから入力内容を変更できます。 一覧表系も追加できます。自動改ページもあります。 定義をHTML保存することもできます。 HTMLの定義書です。 こういう情報は受託開発などで役立ちそうです。 コードのサンプルです。作成したレイアウトファイルを読み込んで、値を変更しつつ最後にPDFファイルを指定して保存しています。 Rubygemsを使ってThinReportsをインストールします。 先ほどのコードを実行すると
The Apache Tika toolkit detects and extracts metadata and structured text content from various documents. Apache Tikaの初のメジャーリリースとなる「Apache Tika 1.0」が公開された。Apache TikaはJavaで開発されたドキュメント分析およびメタデータ抽出ツールキット。さまざまなドキュメント形式に対応しており、対象データからメタデータの抽出を実施する。Tikaは以前はApache Luceneのサブプロジェクトだったが、現在ではApacheソフトウェアファウンデーション直下のプロジェクトとして扱われている。 Apache Tikaが対応しているドキュメントはHTML、XHTML、OOXML、ODF、Microsoft Office (OLE 2、OOXML)
xdoc2txt.exe [-s|-e|-j][-c][-f][-p][-n][-r=(0|1|2)] <filename...> -h ヘルプの表示 -s 出力のエンコードはShiftJIS(デフォルト) -j 出力のエンコードはJIS -s 出力のエンコードはEUC -c PDFキャッシュ on(デフォルトはoff) -f 変換結果をファイルに出力。デフォルトでは標準出力に出力 -p OLE2複合文書の場合、文書プロパティを表示(Office、一太郎で有効) -n PDF文書のアクセス権限の設定を無視(cryptlib.dllが必要) -r= HTML文書のルビの変換 -r=0 ルビ削除 -r=1 () -r=2 《》青空文庫形式 -o= その他のオプション -o=0 PDFで -- ? -- の形式のページ番号を表示しない -o=1 PDFで改行を削除(
Sphinx makes it easy to create intelligent and beautiful documentation. Here are some of Sphinx’s major features: Output formats: HTML (including Windows HTML Help), LaTeX (for printable PDF versions), ePub, Texinfo, manual pages, plain text Extensive cross-references: semantic markup and automatic links for functions, classes, citations, glossary terms and similar pieces of information Hierarchic
Apache PDFBox Overview License Download Community Support Mailing Lists Issue Tracker Project Team Documentation 4.0 (not released) Migration Guide 3.0 Migration Guide Getting Started Dependencies Command-Line Tools FAQ API Docs via javadoc.io 2.0 Migration Guide Getting Started Examples Dependencies Cookbook Document Encryption Command-Line Tools FAQ API Docs via javadoc.io Development Building f
PHPでPDFを作成する必要があったのだが、以前使ってたFPDFが何やらobsoleteって感じになっていて、それを機能拡張した(?)TCPDFというのが登場していた。 ググると「日本語フォントが埋め込みなので実際には使えねぇ~」というのがほとんどだが、現在はAcrobatで標準な小塚明朝と小塚ゴシックを指定すればフォンとの埋め込み無しで利用できる。Ubuntuで文書ビューア(evince)を使っても問題なく見ることが出来る。 Unicodeの扱いも問題無いしという感じだったのだが、フッタにUnicodeフォント指定してなかったらプロパティで日本語が出なかったり、暗号化を指定した場合に漢字が表示されなかったりといった不具合があったが、作者が外人なので何人かに迷惑かけながら配布サイトへ報告したら即対応してくれた。 HTMLでいうvalignが実装されていない以外はとっても便利に使えるので、と
'; doc += ''; doc += ''; doc += ''; winimg.document.writeln(doc); winimg.document.close(); } //]]> ミュートス・ラボ Mythos-labo - TCPDFを使ってみる UTF-8が使えるPHPのPDFライブラリを探していた時に TCPDFというのがあると知り、色々と調べていたところ 「フォント埋め込みされることが原因で、ファイルサイズが大きくなってしまう」 というコメントがたくさん見つかりました。 そこで、マニュアルを読んだところ フォント埋め込みをせずにPDF出力する方法があると分かったので ちょこっとご紹介。 1.ダウンロード TCPDFの本家サイトから最新のソースをダウンロードする http://www.tecnick.com/public/code/cp_dpage.ph
Safariではレンダリングエンジンとして、WebKitが採用されている。iPhoneやAndroid、Palmといったモバイル機器やAdobe AIRでもWebKitをレンダリングエンジンとしており、そのシェアは拡大中だ。高速なレンダリングが可能であり、何よりオープンソースだ。 WebKitを使ったHTML2PDF そんなWebKitを使ってWebページをPDFに変換してくれるのがwkhtmltopdfだ。 今回紹介するオープンソース・ソフトウェアはwkhtmltopdf、Windowsで使えるHTML2PDFだ。 wkhtmltopdfはコマンドラインで使うソフトウェアで、URLやHTMLファイルを渡すと、それをWebKitでレンダリングした結果をPDFファイルとして保存する。日本語も利用可能だ。オプションがとにかく多彩に用意されている。 オプションが多彩 表示に関するオプションの他、
PDFtk is a simple tool for doing everyday things with PDF documents. It comes in three flavors: PDFtk Free, PDFtk Pro, and our original command-line tool PDFtk Server. PDFtk PDFtk Free is our friendly graphical tool for quickly merging and splitting PDF documents and pages. It is free to use for as long as you like. Power Users: PDFtk Free comes with our command-line tool, PDFtk Server. So you get
独立行政法人 情報処理推進機構のフォント(IPAフォント)付き GRASS国際化版(i18n) GRASSで日本語表示を行うためのTrueTypeフォント(IPAフォント)をアーカイブに同封しました.IPAフォント5書体すべてを同封したフルバージョンとゴシック体フォントのみを同封した1フォントバージョンの2つのアーカイブがあります. A.GRASSでの利用方法 ・インストール インストール作業はrootで行ってください. 1.次のIPAフォント付きバイナリーパッケージファイルをダウンロードしてください ・1フォントバージョン(39460108byte) grass5.0.3_i686-pc-linux-i18n-ipa1-gnu_bin.tar.gz ・フルフォントバージョン(47275548byte) grass5.0.3_i686-pc-linux-i18n-ipafull-gnu_b
By: Alexander Veremyev Introduction The Zend_Pdf component of the Zend Framework is intended to allow you to create or manipulate PDF documents from within your applications. In addition to its text handling capabilities, it comes complete with drawing features that allow you to create or manipulate graphical primitives. When working with text Zend_Pdf gives you the option of using the built-in
\閉鎖予定のサイトも売れるかも?/ アクセスがないサイトもコンテンツ価値で売れる場合も… ドメインの有効期限を更新してサイト売却にトライしてみましょう
HTML 2 (F)PDF Project HTML2PDFを使えば、HTMLをPDFに変換することが出来ます。 これがこれに変換できてしまいます。帳票作りなどの場合には、便利かもしれません。 CSSによるデザインもある程度変換対象になるようです。 CSSで書かれたHTML→変換後 すべてのタグに対応できるわけではなく、変換可能なタグは限られているようなので注意が必要です。 変換できるHTMLタグはFEATURESのページで確認できます。 注) 日本語対応かどうかは未確認です。 HTML2PDFを使った変換サンプル: http://html2fpdf.sourceforge.net/examples.php
dompdf - The PHP 5 HTML to PDF Converter dompdf is an HTML to PDF converter. At its heart, dompdf is (mostly) CSS2.1 compliant HTML layout and rendering engine written in PHP. It is a style-driven renderer: it will download and read external stylesheets, inline style tags, and the style attributes of individual HTML elements. It also supports most presentational HTML attributes. PHP5でHTMLをPDFに変換する
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く