タグ

ブックマーク / www.antenna.co.jp (3)

  • プログラマーから見たPDFファイル - アンテナハウス PDF資料室

    更新日: 2020年8月14日 このページの目的 プログラマーは、クライアントから提供されたPDFファイルで、その要求を実現させようとしたとき、PDFのどんなところを見ているのでしょうか。このページでは、ちょっと珍しい視点でPDFファイルを解き明かしていきます。 自分でプログラムを書いてPDFファイルからテキストデータを取り出したいという人も、ぜひご一読ください。 はじめに PDFファイルをクリックすると、あたかも紙に印刷したかのように、どんなマシンでも同じような見た目で文章や画像がディスプレイに表示されます。 この単純な事実は、日常的にPDFファイルを利用していると当たり前に感じられるかもしれません。しかし、よくよく考えると驚くべきことです。 いったい、どのような仕組みがあれば、「過去から現在に至るさまざまな種類のコンピューターで見た目を変えずに同一の紙面を再現する」という目的を達成でき

    プログラマーから見たPDFファイル - アンテナハウス PDF資料室
    mkusunok
    mkusunok 2020/08/15
    PDFからテキストを取り出すのがムッチャ大変という記事。アクセシビリティ、読み上げソフト用のメタデータなんかはもっと読み出しやすいかたちでは入ってないのかな?
  • XSL-FOの基礎 第2版 - XMLを組版するためのレイアウト仕様

    AH Formatter アンテナハウス株式会社 全文検索 目次 はじめに 第1章 XSL-FO による組版の概要 1–1 組版で配慮すべきいくつかの項目 1–2 XSL-FOによる組版プロセス 1–3 XMLドキュメント 1–4 XSLT 1–5 XSL-FOドキュメントの例 1–6 XSL-FOプロセサ 1–7 XSL-FOユーザーとXSL-FOプロセサの役割 第2章 FOツリーの基構造 2–1 fo:rootとその子供たち 2–2 簡単な冊子FOドキュメントと組版例 第3章 ページマスターとページシーケンス 3–1 単純ページマスター 3–2 文区画 3–3 ページシーケンス 3–4 フロー内容 3–5 静的内容 3–6 流し込み区画の対応付け 3–7 タイトル 第4章 ページレイアウトの切り替え 4–1 のページレイアウト 4–2 ページマスターの参照方法 4–3 ページシー

    mkusunok
    mkusunok 2017/03/20
    オンデマンド出版や電子書籍の発売に加えてWebで全文公開されてる。すごいサービスだな
  • 紙と電子のハイブリッド出版を実現する 汎用書籍編集・制作サービス

    紙と電子のハイブリッド出版を実現する 汎用書籍編集・制作サービス 最終更新日: 2011/02/08 アンテナハウス株式会社 スライドPage 2011 2011年2月3日12:30-14:30 G3 「電子書籍の未来とEPUBフォーマットの活用」の講演資料 ☞ パワーポイント・スライド(PDFファイル) 次は講演のために用意したノートを少し改訂したものです(当日は、ノートを見ないでお話ししましたので、話の内容と若干のずれがあることをお断りします)。 日の話の趣旨 最初に、印刷用の書籍の作成と、電子書籍の制作のワークフローは質的に異なっているが、これを両立させる必要があることを述べる。 そしてそれを解決するにはどうしたら良いかを述べる。 解決策の一つとして、現在開発中の「クラウド型汎用書籍編集・制作システム(CAS-UB)」について、デモを交えて紹介する。 「を書こう・を作ろう」

    mkusunok
    mkusunok 2011/02/05
    紙と電子のワークフローの違いがよく整理されている。利フローのある世界でのWYSIWYG問題はHTMLエディタで古くからある課題
  • 1