タグ

ブックマーク / www.antenna.co.jp (2)

  • プログラマーから見たPDFファイル - アンテナハウス PDF資料室

    更新日: 2020年8月14日 このページの目的 プログラマーは、クライアントから提供されたPDFファイルで、その要求を実現させようとしたとき、PDFのどんなところを見ているのでしょうか。このページでは、ちょっと珍しい視点でPDFファイルを解き明かしていきます。 自分でプログラムを書いてPDFファイルからテキストデータを取り出したいという人も、ぜひご一読ください。 はじめに PDFファイルをクリックすると、あたかも紙に印刷したかのように、どんなマシンでも同じような見た目で文章や画像がディスプレイに表示されます。 この単純な事実は、日常的にPDFファイルを利用していると当たり前に感じられるかもしれません。しかし、よくよく考えると驚くべきことです。 いったい、どのような仕組みがあれば、「過去から現在に至るさまざまな種類のコンピューターで見た目を変えずに同一の紙面を再現する」という目的を達成でき

    プログラマーから見たPDFファイル - アンテナハウス PDF資料室
    ardarim
    ardarim 2020/08/14
    「本稿で扱うのは、PDFファイルの中のバイナリデータを解析してみたものの、そこからテキストデータをうまく取り出せず、そういうものかと思って断念した経験があるような方向けの話題です」ニッチ需要ww
  • さまざまなPDFの作成技術の概観 | アンテナハウス PDF資料室

    Acrobat 4では、PDFWriterとDistillerの2種類のプリンタードライバーがあり、両方とも既定値でインストールされました。 Acrobat 5で、Acrobat Distillerがプリンタードライバーの主流になり、PDFWriterは既定値ではインストールされなくなりました。 Acrobat 6以降では、プリンタードライバーがAdobe PDFという名前のものひとつだけになりました。 最初、アドビシステムズはDistillerをプリンタードライバーではなく、PostScriptからPDFへの変換を行うアプリケーションとして用意しました。Acrobat4、5では、それが、プリンタードライバーの名前にも使われていたのですが、Acrobat6以降、Distillerという名前は、プリンターの名前ではなくなり、PostScriptからPDFへの変換を行うアプリケーションのみとな

  • 1