タグ

pdfに関するguitarshooterのブックマーク (19)

  • 詳細PDF入門 ー 実装して学ぼう!PDFファイルの構造とその書き方読み方 - プログラムモグモグ

    PDFのファイル構造を理解すると、テキストエディタでも直接PDFファイルを作ることができるようになります。このエントリーではPDFファイルの基礎要素を説明し、簡単なPDFファイルを例にしてファイル構造を説明します。更に、テキストを渡すとPDFファイルを吐いてくれる簡単なプログラムや、PDFを読み込んで簡単な解析をするプログラムを書いてみます。 目次 目次 まえがき オブジェクト 間接参照 ファイル構造 Hello, world! ヘッダ トレーラ 相互参照テーブル PDFを生成するプログラム 日語の扱い方 日語を含むPDFを生成するプログラム グラフィックス PDFを読むプログラム あとがき まえがき 1990年代前半、アドビシステムズは、どのプラットフォームやデバイスでも文書を確実に表示・共有できることを目的としてPDFファイルフォーマットを開発しました。 PDFの表示ソフト

    詳細PDF入門 ー 実装して学ぼう!PDFファイルの構造とその書き方読み方 - プログラムモグモグ
  • CNET Japan - mobile

    人気の記事 1「motorola razr 50/50 ultra」実機を試す--デザインも中身もさらに「楽しく」 2024年06月29日 2「VITURE Pro」レビュー:愛用のXRグラスがさらに進化、ゲームにも映画にも活躍中 2024年06月28日 3楽天「プラチナバンド」、YouTubeユーザー規制強化など--週間人気記事をナナメ読み(6月21日~6月27日) 2024年06月28日 4高性能キーボードHHKBに輪島塗モデルが復興支援で再び--1万9800円からのキートップも 2024年06月27日 5Instagramで「既読」を付けずにDMを閲覧する方法 2024年03月11日 6過去のホームページを収集・公開しているウェブアーカイブサービス7選 2016年01月31日 7LG、PC不要で「Netflix」など視聴できるモニター--「Makuake」3006%達成、全国販売へ

    CNET Japan - mobile
  • LinuxでPDFファイルを分割/結合するには - @IT

    pdftkというPDFのツールキットを使えば、PDFファイルの分割/結合が可能だ。pdftkは、http://www.accesspdf.com/pdftk/から入手できる。ただし、[Download Pdftk]のページにあるのはDebian用やSUSE用などのパッケージである。tarボールは[Build Pdftk]のリンクからダウンロードする。Fedora Core 5の場合はパッケージがFedora Extrasに用意されているので、yumコマンドでインストールできる。

  • 要約のコツを教えてくれるPDF見つけたよ: うらおもて人生感。

    ・要約のすすめ 読売新聞の記者代ゼミの国語科の土生さんが書いた要約のコツ。非常に読みやすい。 ※矢吹さん、訂正のご指摘ありがとうございます。 ・要約の基礎徹底 38ページもある徹底した要約講義。 軽妙な語り口でホイホイ読めちゃいます。ばっちり演習問題もある親切設計。 無料でこのクオリティは驚きの一言。 ※PDFに直リンしているので、ご注意を。 +0723 追記 7/22に「要約の基礎徹底」の著者、矢吹芳裕さんがツイッターで当記事をご紹介いただきました。ありがとうございます。 感謝を込めて、ここで矢吹さんの運営されているブログとwikiをご紹介します。 こちらも要約、ひいては文章書きにヒントを与えてくれる内容です。おすすめ。 僕は昨日と今日で、Garbage Out!!とwikiは読んじゃいました。すぐに読めちゃう筆致がプロい。 ・Garbage Out!! 広く文章の書き方を教え考えさせて

  • mPDF5.4で日本語を使う | やすみじかん

    mPDF5.4で日語を使うmPDF 5.4で日語を使う方法とちょっとした注意点。 日語を含む要素にはlang=”ja”属性をつける。 だいたいの場合,<body lang=”ja”>とすればOK mPDFで日フォントを使うための設定をする。 日フォントの設定は↓のどれか1つやればOK。 mPDFのコンフィグを変更($this->useAdobeCJK = true) mPDFオブジェクト作成後に$mpdf->useAdobeCJK = true;とする 日語用ttfフォントを設定 ↓は2.でやってる。 require_once '../../php_libs/MPDF54/mpdf.php'; $html = file_get_contents("http://www.yahoo.co.jp"); $html = preg_replace('/(<body.*?)>/',

  • PHP で HTML から簡単に PDF を作れる mPDF | Sun Limited Mt.

    帳票などを HTML を表示し、それを PDF にしたいことはよくあります。FPDF などを使えば PHPPDF を生成することもできますが、結構面倒です。しかし mPDF を使うことにより PHP で簡単に HTML から PDF を生成することが可能です。 インストール mPDF をインストールします。mPDF のサイトより zip ファイルをダウンロードし、解凍します。それを PHP からインクルードできるディレクトリへアップロードします。今回は mpdf というディレクトリを作りその中にアップロードしました。 アップロード後、tmp ディレクトリと graph_cache ディレクトリに書き込み権限を与えておきます。 mPDFPDF を生成する 使い方は簡単です。HTML を与えて、出力するだけです。使い方の例は以下のようになります。例として Yahoo!ジャパンのトッ

  • AndroidでPDFが読みたいのだけど…

    AndroidPDFファイル読む時って、皆さんどうしているのでしょう? Android Dev Phone 1(以下ADP1と記述)でAndroid Marketを探したりネットで検索してみるとPDFを読むためのアプリ(Viewer, Reader)がいくつか見つかるのですが、私の環境では読みたいPDFファイルを読むことができません。 仕方ないので、GIMPでPDFファイルをインポートしてContinus SaveというScript-fuを使用して複数のPNGファイルに変換し、Picturesという画像ビューアで読んでいました。 ところが、やはり画像ビューアでは文章を読むのに適しているとは言えません。 読む前に必ず画像の拡大をしなければならなかったり、画像を拡大しようとしたのにタッチした場所が悪くて次のファイルに移ってしまったり…。 そこでAndroid Marketに登録されているDr

  • Desire for wealth : ScanSnap の自炊 pdf を自動で美白化(レベル補正)する

    以前書いたエントリで、うちの断裁スキャンのポリシーは以下であると書きました。 拙速主義(サイズ、画質ともに気にしない) 袋とじや、折り込みページもスキャンしない(何も考えずにできる事だけをする) スキャンは雑誌のみとし、断裁後すぐ捨てる(単行を切るべきかなどで悩まない) 現在、一ヶ月にスキャンしているコミック誌は70冊程度ですが、これを維持し続けるには、ScanSnap が出力する以上のことはやらないとあらかじめ決めるのが肝要だと思っていたのです。 ところが、先週 Kindle が届いてみるとそうも言ってられず…。 コミック雑誌の紙の色が問題なんですね。iPadiPhone で読むぶんには紙の色がそのまま表示されますからあまり気にならないんですが、Kindle はグレースケールなので紙の色によってはインクがよく見えないというね…。 そこで「pdf の美白化」をしようと思い立ちました

  • メンテナンス中

    申し訳ございません。 只今メンテナンス中です。

  • PDFを « 検索結果: « ねむい蔵ブログ (日常、ビリヤード、音楽、写真、映画、ITの話題を日記に。)

  • AndroidでPDFが読みたいのだけど…

    AndroidPDFファイル読む時って、皆さんどうしているのでしょう? Android Dev Phone 1(以下ADP1と記述)でAndroid Marketを探したりネットで検索してみるとPDFを読むためのアプリ(Viewer, Reader)がいくつか見つかるのですが、私の環境では読みたいPDFファイルを読むことができません。 仕方ないので、GIMPでPDFファイルをインポートしてContinus SaveというScript-fuを使用して複数のPNGファイルに変換し、Picturesという画像ビューアで読んでいました。 ところが、やはり画像ビューアでは文章を読むのに適しているとは言えません。 読む前に必ず画像の拡大をしなければならなかったり、画像を拡大しようとしたのにタッチした場所が悪くて次のファイルに移ってしまったり…。 そこでAndroid Marketに登録されているDr

  • サーバ上でPDFやオフィス文書からテキストを抜き出す方法あれこれ - 2010-08-02 - ククログ

    groongaなどを使って全文検索システムを作るときは、PDFやオフィス文書などからテキスト情報を抜きだして検索用インデックスを作る必要があります。Windowsでテキストを抽出するソフトウェアとしてはxdoc2txtなどがありますが、ここでは、Linuxサーバ上でテキストを抽出する方法を紹介します。 PDF Linux上でPDFを閲覧する場合は、昔はXpdfでしたが、最近はEvinceやOkularの方がよく使われているようです。どちらもPDFの処理にはXpdfからforkしたPopplerというライブラリを使っています。 popplerにはPDFからテキストを抽出するpdftotextというコマンドが付属しているため、それを利用してPDFからテキストを抽出できます。 % pdftotext hello.pdf hello.txt これでhello.pdfのテキスト情報がhello.tx

    サーバ上でPDFやオフィス文書からテキストを抜き出す方法あれこれ - 2010-08-02 - ククログ
  • オープンソースだからこその - 身の回り4畳半近辺の日記

    Boot CampのWindows XPにVisual Studio 2008 Professional Edition アカデミックをインストールしました。特に何も考えずにデフォルトで。Microsoft Visual Studio 2008のインストール完了に時間がかかってハングしたのか。と思ったもののそのままの状態でしばらくかかって次に移りました。 まずはXpdfのコンパイルです。会社のPowerEdge 2900IIIのWindows Server 2003でNamazuを使うのにPDFの検索でXpdfが必要になっています。Win32用のバイナリはあるのですが、そこはそれ事情がありましてpdftotextをちょこっと修正したのが必要なんですねぇ。でメニューに登録された「Visual Studio 2008コマンド プロンプト」から起動して、ダウンロード後、展開したxpdfのディレク

    オープンソースだからこその - 身の回り4畳半近辺の日記
  • のほほん徒然

    第五十一回 最近は研究が忙しいのと,RailsをせっかくさわってるんだからBlogもRailsアプリにするべきじゃない?という短絡的な思考でtypoでBlogを作ってみました. acts_as_ludia や,acts_as_find_or_initialize_by といったプラグインのこともちょこっと書いてます. 私自身が非常に飽きっぽいのでいつまで続くか分かりませんが,お時間があればのぞいてあげてください. 新しく作ったBlogはもちろんtypoがベースになっていますが,実はRuby-GetText-Packageを利用して日語化しようと目論んでいたりします.設定画面の一部などが今は日語になってきています.その話もおいおい. typoベースの私のブログ http://blog.fulltext-search.biz/ 第五十回 [myname@localhost wikipedi

    のほほん徒然
  • PDF文書からテキストを抽出する - のほほん徒然

    第二十一回 論文PDFをHyper Estraierで検索できるようにするため,PDF文書をインデックスに登録する必要がある.しかし,Hyper Estraier付属のPDF文書用スクリプトはHTML文書に変換した後,インデックスに追加するという動作をしていた.さらに,タイトルにPDF文書のファイル名ではなく,PDFが作成された際に付けられていたファイル名を付けてしまうなど,いまいちこちらのニーズに合わなかったので自分で作っちゃうことにした. 来は,シェルスクリプトで書かれた標準添付されたスクリプトを書き直すべきなのだろうが,今回はAPIを使用してRubyスクリプトを作りたかった.そこで,まずはPDF文書からテキストを抽出することから始めてみた. 様々なツール・ソフトがあるようだが,自分は「pdftotext」を使ってみることに.これは,「xpdf」というLinux用ソフトに添付されてい

    PDF文書からテキストを抽出する - のほほん徒然
  • PDF VBA関連

    各テキストの中心座標の Y 座標の差が、頁内のテキストの平均的な高さ(Y座標)の1/4の範囲に有れば、同じ行のテキストと判断します。1/4は経験則から出した独自の値です(変更可能:C_DEV 定数)。 ヘッダー、フッターと判断する条件 以下の条件を全て必要とします。 1行目から次ページと同じ位置に同じテキストが存在する時にヘッダーとします。最終行から次ページと同じ位置に同じテキストが存在する時にフッターとします。ヘッダーは下の行へ、フッターは上の行へ連続行の判断もします。 数字と記号以外のテキストが同じ。 変化するページ番号を無視する為の条件です。「年月日」の文字も無視します。テキストの横方向のX座標は見ません。 前後するページ上のテキストの中心座標Yの差がほぼ同じ。 テキストの中心座標Yの差は前ページのテキストの平均的な高さの1/4です(変更可能:C_DEV 定数)。 次ページの同じ位置

  • EXCEL VBAで→PDF化→自動メール送信

    現在EXCELVBAでプリンターに出力された納品書を毎日50社ぐらいの顧客に手動FAXにて送っています。 通信費削減のために、ファイルをPDF化してEMAIL送信出来るようにしたいと思っています。 添付するファイルがEXCEL BOOKのままであれば以下のコードで出来るのですが、PDF化するやり方が分かりません。 ActiveWorkbook.SendMail Recipients:="email@*****.co.jp", _ Subject:="test" 10万円程度であれば、Adobe Acrobatなどのソフト購入してでも実現させたいと思っています。 又、ユーザーの操作はメーラーの「送信」ボタンをクリックする程度に留めたいです。 よきアドバイスよろしくお願いいたします。 Wordドキュメント → PDF への変換なら、以前VBのメーリングリストでコードを見たことがあり、それを元に

    EXCEL VBAで→PDF化→自動メール送信
  • OpenOffice.org: バッチ処理で .odt-.doc 相互変換、PDF出力 | anobota

    OpenOffice.org: バッチ処理で .odt-.doc 相互変換、PDF出力 2014-07-20 追記 最近のバージョンでは --convert-to というオプションが用意されていて もっと簡単に変換できるようです。 参考: 【LibreOffice】headlessでファイルコンバータとして使う【Output Fileter Name】 | 熊でWEB開発もホームページ制作もしない(2013-11-30) OpenOffice.org Writer の .odtファイルと Microsoft Word の .docファイルを CUIなバッチ処理で相互変換したり、 PDFに出力する方法。 できれば便利なのにと前々から思ってましたが、マクロを利用して実際できてしまうことが分かりました。 詳しくは元ネタである以下のリンク先を見ていただくとして、簡単に手順を紹介してみます。 XM

  • Acrobatを使わずにPDFファイルを編集する方法 | 経営 | マイコミジャーナル

    Digital Inspiration: A Technology Blog on Software and Web Applications 閲覧を目的としたドキュメントデータ形式としてPDFが普及している。PDFが普及した理由には、複数のOSやデバイスで閲覧できる、どの環境でも同じように表示される、ファイルサイズが小さい、そう簡単には編集できない、印刷を避けるように設定できる、パスワードを設定できる、プラグインを使えばブラウザからも簡単に閲覧できる、といった理由がある。 閲覧には便利なデータ形式だが、半面、編集はしずらい。「文章のここにちょっとした注釈を加えて返信したい」、と思ってもAcrobat Readerでは編集できない。Manu Manjunath氏がDigital InspirationにおいてHow to Edit PDF Files - Free Tools for Ma

  • 1