タグ

ブックマーク / blog.antenna.co.jp (27)

  • PDFの色指定について

    無料のPDF編集ツールはどの程度使えるか―Smallpdfは無料で使える? 【ご注意】Microsoft Copilotの回答は、ときどき、お頭が空っぽなオーム並みのことがあります'; collapsItems['collapsArch-2024-4:2'] = ' Google検索、PDF編集は「無料」にハックされているか? Google 検索、劣化してない?'; collapsItems['collapsArch-2024-3:2'] = ' 『AWSなどでMicrosoft製品(SPLAライセンス)が使えなくなる!?』ってホント??'; collapsItems['collapsArch-2024-2:2'] = ' 米国国債の利回り変化と国債価格の値動きを調べてみた'; collapsItems['collapsArch-2023-12:2'] = ' DeepLによるHTML翻訳

    kzakza
    kzakza 2014/03/10
  • W3C eBooks Workshopに参加。そしてDigital Publishing Interest Groupのこと

    無料のPDF編集ツールはどの程度使えるか―Smallpdfは無料で使える? 【ご注意】Microsoft Copilotの回答は、ときどき、お頭が空っぽなオーム並みのことがあります'; collapsItems['collapsArch-2024-4:2'] = ' Google検索、PDF編集は「無料」にハックされているか? Google 検索、劣化してない?'; collapsItems['collapsArch-2024-3:2'] = ' 『AWSなどでMicrosoft製品(SPLAライセンス)が使えなくなる!?』ってホント??'; collapsItems['collapsArch-2024-2:2'] = ' 米国国債の利回り変化と国債価格の値動きを調べてみた'; collapsItems['collapsArch-2023-12:2'] = ' DeepLによるHTML翻訳

  • PDF 千夜一夜: PDFからテキスト抽出のために ToUnicode CMap

    PDFにおけるフォントの取り扱いに関連して、ToUnicode CMapというものがあります。今日はこれについて説明します。 アウトライン・フォントについての説明でお分かりいただけたかと思いますが、PDFにアウトライン・フォントを使って記録された文字を表示する仕組みは、フォントの中にあるグリフのアウトラインをラスタライザで可視化することになります。 これに対して、もう一つのPDFの利用方法として、PDFを読み上げたり、あるいは、検索エンジンで検索したり、あるいはテキスト情報を取り出して他のアプリケーションで使用する、などが考えられます。 通常、上で述べたような処理にはテキストが必要です。テキストについては、2005年12月15日 PDFと文字(4) – 文字の取り扱いで説明しましたので、初めての方は12月15日の話をお読みになってみてください。 PDFの中では、文字を可視化するための情報が

    kzakza
    kzakza 2013/05/01
  • I love software!: PDF/UA(ISO 14289-1)について 個別 アーカイブ

    今回、および次回は PDF/UAと呼称される ISO 14289-1 規格について記載してみます。 ISO 14289-1(以下、PDF/UA)は昨年、国際標準となった規格で、規格書初版は 2012年7月25日に初版が発行されています。 規格書のタイトルは、 Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) となっています。 PDF/UAも今まで説明してきた、PDF/X、PDF/Aの各規格同様に、PDFの仕様書をベースとして、それぞれの用途に沿った規則を設けたものになります。今回とりあげる ISO 14289-1という版は 、タイトルにもありますように、ISO 3200

    kzakza
    kzakza 2013/04/12
    国際規格化されたアクセシブルPDFについて。
  • koboのEPUB3縦書きをためしてみた (CSS組版ブログ)

    前回記事ではUTR50(Unicode縦書きの文字の向き仕様)の議論を紹介しましたが、UTR50が何に使われるかというと、まずCSS縦書き仕様(CSS3 Writing Modes)であり、それを使っているEPUB3の縦書き実装です。そこで最新のEPUB3対応リーダー(とくにkobo Touch)で縦書きの文字の向きがどうなっているか、ためしてみました。 縦書きでの文字の方向をテストするEPUB3サンプルを作りました。 EpubTextOrientation.kepub.epub: いくつかの文字について-epub-text-orientation対応をテスト UnicodeVertical2.kepub.epub: Unicode全体について縦書きの文字の向きmvoとsvoをテスト 次の画像は、サンプルEpubTextOrientation.kepub.epubをkoboで表示したもの

  • PDF 千夜一夜: 2006年04月17日 アーカイブ

    PDFのメタデータ (3) — XMP仕様について PDFのmetadata streamにXMPパケットを埋め込むと言いましたが、このあたりをもう少し詳しく、見ておきます。 まず、XMPの仕様書とツールキットは、アドビシステムズからオープン・ソースライセンスで提供されています。ライセンス文書によりますと、ツールキットについては誰でもソースコートを改良してアプリケーションに組み込んで再頒布できるとされています。 そこで、早速、ダウンロードしたものを再配布することにしました。こちらにあります。 XMPは、次のようなXMLテキストです。 ルート要素はxmpmeta(オプション)でその下位の唯一の要素としてrdf:RDFをもちます。(恐らく、xmpmetaは旧バージョンとの互換性のために残されているもので、最新版では、rdf:RDFがルート要素として取り扱われると思います)。 rdfの名前空間宣

  • PDF 千夜一夜: 2006年04月15日 アーカイブ

    PDFのメタデータ (1) — ドキュメント情報辞書 PDFのメタデータは、二通りの持ち方になります。 ひとつは、ドキュメント情報辞書としてもつもの。他のひとつは、メタデータ・ストリームとしてもつものです。 ドキュメント情報辞書には次の情報を設定できます。 ・Title(タイトル) ・Author(著者) ・Subject(主題) ・Keywords(キーワード) ・Creator(オリジナルのドキュメントを作成したアプリケーション) ・Producer(PDFを作成したアプリケーション) ・CreationDate(作成日) ・ModDate(修正した日) ・Trapped(トラップ処理が行われたかどうか) このドキュメント情報の多くは、Adobe ReaderでPDFを表示したとき、文書の属性として確認することができます。 この中で、トラップ処理が行われたかどうかちょっと異色です。これ

  • PDF 千夜一夜: 2006年04月16日 アーカイブ

    PDFのメタデータ (2) — メタデータストリーム メタデータはPDFの属性(プロパティ)に示されるような、著者、主題、作成日、などファイル内容に関して把握するための情報です。 PDFでは、昨日説明しましたように、ドキュメント情報辞書を使ってファイルにメタデータを付与できます。さらに、もう一つ別の方法で、PDF文書全体、または、PDF文書の中の部品にメタデータを付加することができます。それが、今日説明しますmetadata streamです。 PDFのコンテンツの種類の一つにストリーム・オブジェクトというものがあります。ストリームオブジェクトは、簡単に言いますと一塊のデータに相当します。metadata streamはストリーム・オブジェクトの中の一種類です。 metadata streamについてはPDF Reference 10.2.2 Metadata Streamを参照してくださ

  • PDF 千夜一夜

    2012年01月04日 お知らせ:「PDF千夜一夜」がになります。 明けましておめでとうございます。今年は良い年になりますように! さて、早速ですが、ブログ「PDF千夜一夜」の記事を整理してにする作業を始めました。詳しくはこちらでご案内していますので、どうぞご覧ください。 ☞「PDFインフラストラクチャー解説」EPUBの0.1版を公開 投稿者 koba : 07:57 | コメント (0) | トラックバック (0) 2008年07月12日 PDFの未来 — PDF Every Whereの時代に向けて 1000日間に渡って続けてきましたPDF千夜一夜も今日で最後になりました。かっこよく終わりにしたかったのですが、昨日は、お見苦しい障害のお知らせを書くことになってしまい反省しています。 アンテナハウスは1984年創業ですが、振り返ってみますと、1980年代はMS-DOSテキストファ

    kzakza
    kzakza 2012/06/11
    これがベースになっているのか>「PDFインフラストラクチャー解説(仮)」。ほぼ毎日1000エントリ続けていたのか。
  • 『W3C技術ノート 日本語組版処理の要件』書籍版、CSS組版の事例としても注目! (CSS組版ブログ)

  • I love software!: 日本語組版処理の要件 個別 アーカイブ

    AH Formatter V6 開発にまつわる裏話をひとつ紹介してみましょう。 W3Cに、Requirements for Japanese Text Layout(日語組版処理の要件)という技術文書があります。3月30日現在、第1版が公開されていましたが、4月3日に第2版が公開されました。 第1版では、スケジュールの都合から第4章が欠けた状態で公開されたわけですが、第2版でそれを補い、文書としての完成を見ることとなりました。 この文書は、実装仕様ではなく要求仕様に徹した文書で、もともと JIS X 4051 の英訳が存在しないなどの理由から、日語を解さない外国人にでも日語組版が理解できるようにすることを目指していましたが、日人にとってもよい内容となっています。 AH Formatter V6 の開発は、この文書の要求を実装することであったとも言えます。つまり、 ルビ 圏点 図版の

    kzakza
    kzakza 2012/04/01
    「「日本語組版処理の要件」は、書籍としても東京電機大学出版局から、W3Cでの第2版公開に合わせて近々発売されます。」
  • CSSの縦書きとUnicodeの縦書きの文字の向き(UTR#50)の話題 (CSS組版ブログ)

    (追記2012-02-04)Twitterでの議論まとめ(随時更新中。ハッシュタグは #UTR50) UTR#50(Unicodeの縦書きの文字の向き)の話題 「電子書籍、電子出版のCAS-UBブログ」 のほうで、CSS縦書きとUnicodeの議論 UTR#50: Unicode Properties for Vertical Text Layout (Proposed Draft) がホットです(by小林社長): 縦組みにおける英数字正立論―まとめ 全角英数と半角英数の使い分けの煩わしさをなくす100年1回のチャンスが来ています! ラテンアルファベットと数字を縦にするか、横にするか?UTR#50とCSSの関係 縦組みのPC雑誌における英数字の方向 縦組み書籍における英数字の使われ方―その2 縦組み書籍における英数字の使われ方 未来の縦書き文字の表示はどうなるの? CSS縦書きとUni

  • I love software!: CSS2.1 がW3C勧告に。 個別 アーカイブ

    W3Cは、6月7日(現地時間)、Cascading Style Sheets (CSS)の新しいレベルがW3C勧告になったことを発表しました。CSS3ではなく、CSS2.1です。 ○ニュースリリース(英文) Cascading Style Sheets Standard Boasts Unprecedented Interoperability え!いまさらCSS2.1という感想をもたれる方も多いと思います。CSS2.0が1998年5月に勧告になってから、すでに13年を経過していますので、確かに、その通りです。この間、W3CのCSSワーキング・グループは、CSS3の開発を進めると同時に、CSS2.0の仕様の大幅な見直しを行なってきました。CSS2.1では、CSS2.0で実際に使われなかったプロパティの削除や、既に広く実装されている機能の追加などが行なわれています。 CSS誕生から今年が15

    kzakza
    kzakza 2011/06/09
  • EPUB3.0のその先へ――CSS3 Writing Modes、Text、Line Grid――次世代電子出版とWeb表現技術フォーラム (CSS組版ブログ)

    « 「電子書籍フォーマットEPUB3.0の動向とXML」 | メイン | Formatter Club 発足会のご案内 » EPUB3.0のその先へ――CSS3 Writing Modes、Text、Line Grid――次世代電子出版とWeb表現技術フォーラム cassupportの日記の次のエントリーのとおり、EPUB3.0仕様は進んでいます(今夏遅くに最終の勧告仕様とのこと): 5月23日 EPUB3.0のProposed Specificationが公開されました 「CSS組版」に関係するところは、EPUB Content Documents 3.0 の 3 EPUB Style Sheets です。EPUB3.0で使えることになる CSS のプロパティについて書かれています。 CSS3 Text と Writing Modes については、まだドラフト仕様であるということで、プロ

    kzakza
    kzakza 2011/05/29
    EPUB3に関係するCSSの動向。これはわかりやすい。
  • I love software!: EPUB3.0のProposed Specification公開。今年の終りに勧告へ 個別 アーカイブ

    IDPFは5月23日にEPUB3.0のProposed Specificationを公開しました。 ○International Digital Publishing Forum(IPDF): http://idpf.org/ ○ニュースリリース: http://idpf.org/epub3_proposed_spec_released ○仕様: http://idpf.org/epub/30 ○ドキュメントの索引: http://idpf.org/epub/30/index.html ■EPUB3.0で追加された主な項目: このニュース・リリースによると次の通りです。「EPUB3は、2010年5月に開発を開始した。この仕様は、会員および公開レビュー、早期の実装者による採用を目指している。EPUB3は、今夏遅くに最終の勧告仕様になることを期待している。」 IDPFは組織が小さいだけにスピー

  • I love software!: 雑誌協会で広告入稿データ仕様が策定されたらしい! 個別 アーカイブ

    雑誌協会がこの推進母体になっている「雑誌広告デジタル送稿推進協議会」が雑誌広告の入稿データ仕様/制作環境の指定を行ない始めたようで、この雑誌協会に所属している各広告社がこの仕様での入稿を指定するようになりはじめています。 2011/1月からここで指定されているMacOSX環境でのJ-PDFまたはJ2のみ受け付けとなるとのこと。まだ詳しく調べていませんが、これは結構大変な問題のように感じます。 ○「雑誌広告デジタル送稿推進協議会」 ・推進母体が 日雑誌協会/日雑誌広告協会/日広告業協会。[1] ・雑誌広告のJ-PDF, J2などの入稿データ仕様[2]やJMPAカラーを策定している。 ・2011/1からデータ入稿は、J-PDF, J2のみとなる。[3] ・J-PDF, J2仕様はどちらもJMPAカラー準拠が必要。 ・JMPAカラー準拠PDFの作成環境として Mac OSX, Illust

  • I love software!: 「WebのPDFは重い」が迷信になる時代が来た 個別 アーカイブ

    GoogleChrome8がリリースされた。新しい機能として、PDF表示が加わったということで早速インストールして試してみた。 確かにPDF表示ができる。そして、「驚くほど速い」。 他のブラウザでは、WebページにリンクされているPDFは、ブラウザにプラグインされているPDF Readerを使って読んでいる。WebページにリンクされているPDFを表示するのはかなり時間がかかる。その時間にはブラウザからPDF Readerプラグインを起動したり、WebからPDFをダウンロードしたり、あるいはPDFをリーダがレンダリングする時間が含まれている。一昔前と比べるとこれらの諸元は全般的にかなり速くなってきているので、個人的には、PDF表示に最近はそれほどのストレスを感じていなかった。 しかしChrome8のPDF表示速度は次元が違う。 但し、このPDF表示速度を最大限に生かすには、Web上のPDF

  • W3C TPAC 2010~CSS3 Writing Modes 縦書きと論理方向仕様のゆくえ (CSS組版ブログ)

    W3C TPAC 2010 で CSS3 Writing Modes は… 今月初め、フランスのリオンでのW3C総会 TPAC 2010 のCSS WG会議で、CSS3 Writing Modes仕様について集中して審議されました。 結果は、石井宏治さん(@kojiishi)がツイッターで報告: 縦書きは順調。論理方向は一歩前進したけど及ばず、でも、継続審議にはなった。EPUB3の最低限ゴールからすれば、合格。でも個人的にはちょっと残念。状況からすれば仕方ないか、論理方向を支持する声は国内でも多くはないし。でも蓋を開けると文句噴出かなぁ、という気はします。難しい。 [3 Nov @kojiishi] このとき議論されたこの時点でのCSS3 Writing Modes仕様(11月2日版)は次のものです: CSS Writing Modes Module Level 3 Editor's Dr

    kzakza
    kzakza 2010/11/14
    実現に向けて着実に進んでいるCSSによる縦書き。関係者の方がには本当に感謝です。
  • I love software!: EPUB3.0へのCSS3採用の推進に関して 個別 アーカイブ

    2011年5月策定を目指して、EPUB3.0の仕様策定作業は急ピッチで進んでいます。先週の頭には、サンフランシスコで世界各国の要求事項を絞込み、整理する作業が行われています。 要求事項の中でも重要な項目として、縦書き他の日語組版機能があります。EPUBは、独自の仕様を書き下ろすのではなく、外部の標準的な仕様を参照し、利用する形になります。日語組版機能に関しては、CSS3で策定作業が行われており、EPUBではCSS3を利用することになります。 ところが、CSS3はまだ仕様策定の途中あり、EPUBで必要とする日語組版機能は、次の二つのモジュールとして進んでいます。 (1)CSS Text Level 3 (2)CSS Writing Modes Module Level 3 CSS3側から見ますと、CSS3に縦書きを含む日語レイアウト機能を盛り込む意義は、当面、書籍形式であるEPUBに

  • I love software!: XSL 1.1 がJISになりました 個別 アーカイブ

    10月20日XMLを綺麗に組版するための仕様である「拡張可能なスタイルシート言語(XSL)1.1」 がJIS X 4179 として公示されました。 ○JIS規格書のWebページ このJIS規格は、XSL V1.0の翻訳から初めていたように思います。XSL 1.1 仕様は2006年12月05日にW3C勧告となりましたので、XSL V1.0の翻訳は2005年頃には既にできていたと思います。 それを引き継いで、XSL V1.1に改訂し、その後、JIS化の作業を行ったことになります。アンテナハウス(実際には担当者の石野)はその一部をお手伝いしたのですが、この間、4年は掛かっているものと思います。思えば、実に気の長い話でした。