タグ

ブックマーク / www.antenna.co.jp (9)

  • PDFの内部のテキスト、表、図をXML形式に変換! - PDFXML 変換ライブラリ

    PDFXML 変換ライブラリ V3.0(以下、ライブラリ)は、 PDFファイルを読み込み、内部のテキスト、テーブル、図、画像などをXML形式に変換するプログラムです。 XMLへは文字情報、位置、フォント情報などが出力されます。 ライブラリを使用することで、簡単にPDFデータの再利用ができます。 Antenna House PDFXMLの概要 ライブラリが出力するXML形式を「PDFXML形式」と呼びます。 PDFXML形式は、PDFに含まれるコンテンツをテキスト、表、画像などの情報単位にまとめてXML表現に置き換えます。 PDFのデータを再利用 PDFに含まれるコンテンツをPDFXML形式に変換 PDFXMLとして取り出せる情報 段落、行、文字情報を取得します。 段落、行、文字の位置とサイズ情報(矩形)を得られます。 インデント、行間、文字間情報を得られます。 文字情報(文字の大きさ

    makoto15
    makoto15 2017/06/28
  • XSL-FO による書籍の自動組版

    はじめに アンテナハウスでは、2007年9月25日に「Open Office XML Formats入門」を毎日コミュニケーションズ(マイコミ)から出版いたしました。この書籍は、表紙以外全てを XSL Formatter を使って自動組版し、PDF化し、マイコミはPDFを印刷会社に渡すという方法で制作しました。 商業出版における書籍の制作はDTPによる方法が主流です。しかし、自動組版により、制作期間やコストを削減することが可能な分野も多いと思います。そのためには、商業出版用の書籍を、XSL-FOで制作する経験を重ねて、ツール、スタイルシート、および仕事の進め方を改善していくことが必要でしょう。 ここでは、XSL-FO による書籍の製作におけるその過程や、問題点などについて、かいつまんで紹介します。 DTP による方法との違い 必要な知識 製作過程 XSL-FO による自動組版での留意点 X

  • 【導入事例】AH Formatter V6 による JLReq の自動組版 - Antenna House Formatter

    記事作成:2012年4月25日 概要 W3C技術ノート 日語組版処理の要件 W3C に、Requirements for Japanese Text Layout(日語組版処理の要件)という技術文書があり、2012年4月3日に公開されました。これの公開に合わせて、日語版を書籍化する計画が持ち上がり、それを、『AH Formatter V6』によって実現しました。 書籍化の話が出た当時、『AH Formatter V6』は、まだ開発途中でした。そういう意味では、JLReq の書籍化は、画像のフロートによる自動配置の実装検証として渡りに船であったと言えます。組版は、XHTML+CSS を用いて行なわれました。 ワークフロー 書籍化の準備を始めたとき、Web のための XHTML を生成するワークフローが完成していました。これは、次のように、2段階の XSLT 適用で公開用 XHTML

  • AH Formatter V6 事例紹介セミナー | アンテナハウス

  • GBコードについて【メモ】

    中国政府は、1980年から文字をデジタル化する為に、国家標準符号化文字集合を40回程配布してきました。 この中で主な文字集合は、1バイトと2バイト以上の文字集合です。 1バイト文字集合とは、GB11383-89及びGB1988-89です。 2バイト以上の文字集合は、GB-2312-80(簡体字)、GB/T12345-90(繁体字)、GBK(UCS対応)、GB13000.1やGB18030-2000(UCS及び少数民族文字対応)など色々な種類があります。 以下で中国でよく使っている文字集合をそれぞれご紹介します。 ※ GBという略称は国家標準という意味 GB2312-80 GB2312-80という文字集合は、1980年に政府から中国初の国家標準符号化文字集合として配布されました。GB2312-80は「情報交換用漢字符号化文字集合」と言われ、その中には6763簡体文字と682の記号の合わせて7

  • Web 最適化PDFの意味、用途、効果

    【注意】記事を最初に公開したのは2007年1月です。その後、「Web表示用に最適化したPDF」の仕様は、最新のISO 32000-1、ISO 32000-2でも特に改訂されていません。しかし、PDFの仕様は変わらなくてもインターネットの通信環境は大幅に改善されており、またブラウザでPDFを閲覧する環境も抜的に変わっています。このため記事で紹介している事例やデータは現時点では適切とは言えませんので注意してください。なお、関連する記事として、「ブラウザでPDFファイルをWebページからシームレスに表示するか、ダウンロードするかの設定」を用意しましたのでご参照ください。 Web表示用に最適化したPDFとは PDFの表示が遅い、重いのはなぜ? Webページで配布されているPDFをブラウザで開いてみるとき、PDFのページが表示されるまでに時間がかかる場合があります。いわゆる重いという現象ですが

    makoto15
    makoto15 2009/08/24
    リニアライズドPDF (Linearized PDF) / Fast Web View
  • XMLに関連したWord 2003の機能

    [XML Top] Oct 20, 2003 アンテナハウス株式会社 目次1  XMLに関する機能概要 2  XMLの編集機能2.1  スキーマなしのXMLファイルの編集2.2  スキーマ付きのXMLファイルの編集2.2.1  XMLスキーマの作成2.2.2  XMLスキーマの登録2.2.3  XMLスキーマ付き文書の編集画面3  XMLの編集機能に関する考察3.1  WordでXMLを編集するメリット3.2  WordでXMLを編集する際の問題点3.3  WordでのXMLのビジュアルな編集4  新しいフォーマット WordMLの特徴5  WordMLの概要5.1  ネームスペース5.2  全体の構造5.3  w:bodyの構造5.4  段落(w:p)の構造5.5  テーブル(w:tbl)の構造5.6  リストの構造6  WordMLの活用法6.1  他形式からWordMLへ6.1.1 

  • 多言語組版研究会 組版資料室

    Jump to 「組版資料室」のURLは変更になりました。 のページへ。 手動でジャンプされる場合はここをクリックしてください。

  • Antenna House PDF Viewer SDK

  • 1