タグ

PDFに関するyuuAnのブックマーク (3)

  • プログラマーから見たPDFファイル - アンテナハウス PDF資料室

    更新日: 2020年8月14日 このページの目的 プログラマーは、クライアントから提供されたPDFファイルで、その要求を実現させようとしたとき、PDFのどんなところを見ているのでしょうか。このページでは、ちょっと珍しい視点でPDFファイルを解き明かしていきます。 自分でプログラムを書いてPDFファイルからテキストデータを取り出したいという人も、ぜひご一読ください。 はじめに PDFファイルをクリックすると、あたかも紙に印刷したかのように、どんなマシンでも同じような見た目で文章や画像がディスプレイに表示されます。 この単純な事実は、日常的にPDFファイルを利用していると当たり前に感じられるかもしれません。しかし、よくよく考えると驚くべきことです。 いったい、どのような仕組みがあれば、「過去から現在に至るさまざまな種類のコンピューターで見た目を変えずに同一の紙面を再現する」という目的を達成でき

    プログラマーから見たPDFファイル - アンテナハウス PDF資料室
    yuuAn
    yuuAn 2020/08/15
  • PDF 構文 -ファイル 解析手順-

    PDF1.7はISO技術委員会によって2008年1月に“ISO 32000-1規格”として承認され、 2017年7月にはPDF2.0の規格ISO3200-2が承認され、2020年12月にはこの規格は第二稿になりました。 ここでは32000-2規格で説明されているPDF1.7の構文(構造)について説明しています。 PDFファイルは8-bitデータを単位として構成されていて一般の文書編集アプリケーションで開くことができその内容を読取ることができます。ただし、バイナリのデータもそのまま(表示可能な文字に変換されずに)格納されていますので文字化けしているように表示されますが、これはPDFの仕様です。 ここではそのデータの一部を読み解くことでPDF文書へのデータ追加などPDF再構成の意味を説明しPDF-ToolsでのPDFデータ解析や編集をより詳細にできるようにします。

  • スパルタンVim 5.0のPDF公開 — KaoriYa

    C90 において頒布したスパルタンVim 5.0のPDFを公開いたします。 http://files.kaoriya.net/goto/c90pdf 以下、「はじめに」より抜粋です。 書スパルタンVim 5.0では、 デフォルト状態での機能と基的なキー割り当ての一部について、その背景や利用シーンを解説することで、賢明な読者諸氏により良いキーマップの定義方法について再検討を促してもらおうとするものです。 頒布したものから文の修正等はしていません。印刷用にasciidoctor-pdfの設定を少しいじり、頒布用に圧縮をしてあります。 訂正 H, L, M の説明が誤っています。「カーソルの位置へスクロールする機能」ではなく「カーソルを画面上の特定の位置へ移動する」機能です。 * * *

  • 1