タグ

pdfとsoftwareに関するmoqadaのブックマーク (3)

  • MOONGIFT: » Python上でHTML2PDF「pisa」:オープンソースを毎日紹介

    HTMLPDFに変換することができれば、様々なサービスでの活用が考えられる。Memotuneでも可能だが、mozilla2psを経由するために動作が重たくなりがちだ。 ブラウザのレンダリングエンジンを使わなければ、高速に動作するのは間違いない。そしてPythonで作られたソフトウェアがこれだ。 今回紹介するオープンソース・ソフトウェアはpisa、PythonによるHTML2PDFだ。 pisaはHTML5とCSS2をサポート対象としている。全てのCSSスタイルが利用できる訳ではないが、color/font-family/font-size/display/text-decoration/background-color/border/padding/width/heigth/text-align/white-space等、文字装飾や配置関連のスタイルが指定できる。 また、テンプレートを使

    MOONGIFT: » Python上でHTML2PDF「pisa」:オープンソースを毎日紹介
    moqada
    moqada 2007/11/29
    HTMLをpdfに変換する
  • MOONGIFT: » 無料でPDFのOCR「クセロReader ZERO」:オープンソースを毎日紹介

    うーん、これは凄い。 OCRという技術はフリーでは殆ど見られない(日語では昔あったが、今はない)位、高い専門性と特許が絡んだ難しい技術だ。 それを無料で利用できるというのが素晴らしい。オフィスでも多用されるPDFについて、OCRを適用したければこれを使おう。 今回紹介するフリーウェアはクセロReader ZERO、OCR機能がついたPDFビューワだ。 クセロReader ZEROはタブがついたPDFビューワーで、複数のPDFを閲覧するのに便利なソフトウェアだ。しおりやサムネイルを表示するといった機能もある。 そして最も便利な機能として取りざたされるのがOCR機能だ。試してみた所では多少の誤字認識はあったものの、十分実用レベルだ(PDF中の文字列を検索するという目的には十分)。 さらに画像をクセロReader ZEROにドラッグアンドドロップするだけでPDF化する機能もある。その上でOCR

    MOONGIFT: » 無料でPDFのOCR「クセロReader ZERO」:オープンソースを毎日紹介
    moqada
    moqada 2007/11/09
    画像から文字列を認識して検索可能
  • MOONGIFT: » PDFのパスワードを破る「PDFCrack」:オープンソースを毎日紹介

    ビジネスの場でPDFはごく当たり前に使われている。その中には秘密にしておきたい書類として、パスワードで保護しているものもあるだろう。 幾つもの書類をやり取りしている内にパスワードを忘れてしまったらどうしよう。そんな時に役立つのがこれだ。 今回紹介するオープンソース・ソフトウェアはPDFCrack、PDFのパスワードクラッカーだ。 PDFCrackは英数字のパスワードに対応したクラッキングソフトウェアで、総当たり式(ブルートフォース)にパスワードを調べていく。なので十分に長いパスワードの場合はそれなりに時間がかかる。辞書ファイルを指定すればそこから調べる事もできるようだ。 調べる能力としてはPCの性能にもよるだろうが、50万ワード/秒くらいのようだ。それでも5桁以上になると時間がかかる(単純計算で6桁の場合、全て総当たりすると32時間:a〜z + A〜Z + 0〜9の6乗)。だが、最低長さを

    MOONGIFT: » PDFのパスワードを破る「PDFCrack」:オープンソースを毎日紹介
    moqada
    moqada 2007/10/28
    PDFのパスワードを忘れても大丈夫
  • 1