http://www.mext.go.jp/a_menu/saigaijohou/syousai/1303723.htm このあたりからデータを取得できるわけだが、なぜか PDF なので、うんざりする。 こんなもんどうみても excel かなにかでつくってるんだから生データを提供しろといいたい。 まあ文句をいっていてもしょうがないので、こういう PDF をスクレイピングする方法について解説する。 pdftotext などのコマンドをつかうのがオススメ。今だと、poppler というライブラリが日本語もあつかえてすばらしすぎるので、これをつかうとよい。これは Perl/Python/Ruby のバインディングがあるので、それをつかってもよいがこういう場合、ライブラリなどでがんばって PDF を解析するのはわりと時間の無駄となる場合がおおい。 poppler は homebrew で一発インス
Ruby用PDFライブラリでは、Haru Free PDF Libraryがおすすめ Ruby用PDFライブラリを調べました。 日本語が正しく使用できるものは「Haru Free PDF Library」だけではないでしょうか。 正直なところ、これほど貧弱だとは思いませんでした。 Haru Free PDF Library おすすめ。 詳しくは次の記事で説明します。 Ruport Ruby on Railsと愛称がよさそうです。 内部ではpdf-writerを使用しており、日本語に対応していません。 pdf-writer 日本語に対応していません。 ユーザーレベルでは、いくつはパッチが公開されているようです。 日本語フォントパッチ。バージョン1.1.7用 http://www2s.biglobe.ne.jp/~Nori/ruby/ja/ TrueTypeのフォント埋め込みパッチ。 バージョ
Railsをpassengerで動かしている時に、RJBでJavaのライブラリJasperReportsを呼び出そうとすると うまくいかなかった。 なので、一つの解決法としてJasperReportsの呼び出し部分をRailsとは切り離す仕組みとしてDRubyを採用する。 サンプルは別途リンクを張りますが、ここでは主要なソースのみ書き出します。 まずは、実際にPDFを作成する部分から gen/WritePdf.java: package gendosu; import java.io.File; import java.io.FileInputStream; import java.io.InputStream; import java.io.OutputStream; import java.sql.Connection; import java.sql.DriverManager; i
Perlから直接PDFファイルが出力できたら、何かできるかなぁ?と、思っていろいろ調べてたんですが、PDFJ ってモジュールが良さげだったので、早速試してみました。 作った人が日本人ということもあり、詳細な日本語のドキュメントが用意されていているのも、ありがたいところです。 インストールは作者さんのページからZIPファイルをダウンロードして行います(CPANには登録されていないので)。古いバージョンもダウンロード可能になっていますが、ここは最新バージョンの0.90(2010年1月19日現在)を使わせてもらうことにします。 ZIPファイルを解凍した中の Makefile.PL を使ってインストールするのが簡単ですが、PDFJ.pm と PDFJディレクトリをモジュール検索パスの通っているディレクトリ(例、c:\perl\lib)にコピーするだけでもOKです。 次にPDFJモジュールが使用する
17 フォーラム なぜソフトウェア論文を書くのは 難しい (と感じる) のか 権藤 克彦 明石 修 伊知地 宏 岩崎 英哉 河野 健二 豊田 正史 上田 和紀 「ソフトウェア開発で得られる経験や知見を成果とする論文 (=ソフトウェア論文) を書くことは難しい」とよく言わ れますが, 「なぜ難しいのか」の分析はこれまで十分にはなされていません.本論文では本誌のソフトウェア論文特集 を編集した経験から, 「ソフトウェア論文を書くことがなぜ難しい (と感じる) のか」の分析を試みます.問題は「著 者の作文の問題」だけではなく,ソフトウェア自体,ソフトウェア工学,査読者,社会状況にも要因があることを示 します. 要因が多岐に渡るので結論を短く言うことが難しいです.あえて言えば「著者の作文技術にも問題はあるが,(著 者の責任ではない) 本質的な難しさも別にあるので,著者が自らハードルを上げてし
ファイルのセキュリティ管理はもちろん大切なことですが、コピーNG、印刷NG、編集NGなど、あれもこれもと過度に制限をかけすぎると、不便になってしまうことは往々にしてあるものですね。こちらではこれらの制限からPDFファイルを解放してくれる便利なWebツール「FreeMyPDF」をご紹介しましょう。 「FreeMyPDF」はローカルからPDFファイルをアップロードし、「Do It!」ボタンをクリックするだけで、コピー・印刷・編集などにおける使用制限の設定が解除できます。ただし、このツールはPDFファイルの「開く・読む」のみをサポートするもの。閲覧にパスワードを要するPDFファイルをこのツールでパスワード解除することはできませんので、ご注意くださいね。PDFファイルのパスワード解除ツールとしては「PDF Pirate」や「PDF Crack」といったものがあるそうですので、「自分で設定したパスワ
■編集元:ソフトウェア板より「PDF作成・変換ソフト。Part 6」 1 名無しさん@お腹いっぱい。 :2009/05/01(金) 05:31:17 ID:pqwBMBYy0 PDFの作成。PDFへの変換ソフトについて話し合うスレッドです。 ●過去スレ PDF作成・変換ソフト。Part 5 http://pc12.2ch.net/test/read.cgi/software/1200771165/ PDF作成・変換ソフト。Part 4 http://pc11.2ch.net/test/read.cgi/software/1164038438/ PDF作成・変換ソフト。Part 3 http://pc7.2ch.net/test/read.cgi/software/1137463613/ PDF作成・変換ソフト。その2 http://pc7.2ch.net/test/r
クラウドPDFサービスのパフォーマンス測定について 先日公開したScalable PDFのパフォーマンステストと同様に、クラウドPDFサービス(GAEのReflex iTextサービス)についてもパフォーマンステストを行ったので公開したいと思う。 クラウドPDFサービスは、AmazonEC2のかわりにGAEを使っており、負荷分散機能はGAEまかせとなるが、Reflex iTextのサービスを使っている点はScalable PDFサービスと同じである。ただ、GAEの場合は実行時間など、いろいろな制約があり、リクエストが失敗する前提で設計しなければならないといった考慮が必要となる。今回のテストにおいては、エラー時に時間間隔を置いてリトライする仕組みを取り入れている。 結果としては、以下のように、GAEでも約8千ページを4~5分で処理できたということで、まずまずであったのだが、これがいっぱいいっ
「PDFのセキュリティを外す方法」をキーワードとして WEB検索したところ、下記のブログが見つかった。 PDF 千夜一夜 PDFなんでも情報ブログ by アンテナハウス株式会社 2007年12月26日 「PDF Tool API でセキュリティを外す方法」 http://blog.antenna.co.jp/PDFTool/archives/2007/12/26/#000915 読んでみたが、「プログラム開発者向け」の説明で難しい。 理解できたことは、技術的にも、製品の価格からみても 「個人が簡単に使える方法ではない」ということだ。 手の内にあるアンテナハウス株式会社のエンドユーザ向け製品を探して 「書けまっせ!!PDF3」を使って、セキュリティ設定を外すことができるか 試行してみた。 ① セキュリティ設定の掛っているPDF (Acrobatで確認) ② セキュリティ設
Adobe-Japan1、Adobe-GB1などのグリフセットでは、ひとつひとつのグリフにCIDという番号が付いていることは説明しました。CIDフォント・ファイルには、文字を画面表示したり印刷するためのグリフ・データを収容しています。フォント・ファイルに収容されているグリフ・データにアクセスするときはCID番号を使わなければなりません。 Windows、LinuxやマッキントッシュなどのOSや、OSの上で動くアプリケーションは、Unicode、または機種専用の文字コードを使ってテキストを処理します。一方、CIDフォントにあるグリフを使ってその文字を表示・印刷するには、文字コードからCIDに変換しなければなりません。 この文字コードからCIDへの変換を定義するのがCMapです。 図 CMapで文字コードからCIDへ変換 アドビシステムズはAdobe-Japan1、Adobe-GB1などのグリ
PDFを作成するライブラリは数多く存在する。Webシステムであってもずいぶん手軽にはなってきた。だが、テンプレートのメンテナンス性の良さと使い勝手の良さを兼ね備えたPDF作成ライブラリとなるとまだまだ数は少ないのが実情だ。 GhostScriptを使ったPDF作成ライブラリ RailsをはじめとしたRubyによるPDF出力を行うならば、RGhostを使うのが良さそうだ。 今回紹介するオープンソース・ソフトウェアはRGhost、PDFや画像を生成するRubyライブラリだ。 RGhostはRubyGemsからインストールできるライブラリで、スクリプトからPDFを生成する他、PostScript、PNG、TIF、JPEGといった画像への変換もできる。オブジェクト指向らしい値の埋め込みによってPDFが生成できるので、使い勝手は良さそうだ。 EPSをテンプレートにしたPDF生成も可能 TrueTyp
「瞬簡PDF3」「瞬簡PDF Plus3」を発売しました アンテナハウスでは、本日、「瞬簡PDF3」「瞬簡PDF Plus3」を自社オンラインショップより、ダウンロード販売開始しました。 ○ニュース・リリース ○オンラインショップ ○「瞬簡PDF3」ダウンロード販売 ○「瞬簡PDF Plus3」ダウンロード販売 本製品は、この4月にクセロより譲り受けた旧バージョンのPDF Driverを、クセロPDF2からAntenna House PDF Driver V4.0 Professional に置き換えたものです。 これにより、Windows64ビット版、およびWindows7への対応ができるようになりました。 旧バージョンをお持ちのお客様に対して、それぞれの新バージョン「瞬簡PDF3」及び「瞬簡PDF Plus3」を大変お得なバージョンアップ価格にて販売いたします。 投票をお願いいたします
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く