タグ

ocrとpdfに関するlizyのブックマーク (3)

  • 電子化した本に最適!Adobe Acrobat の PDF 圧縮が予想外に便利すぎて鼻血が出たwww - おいちゃんと呼ばれています

    まずは下の表を見てください。 Perlベストプラクティス 作者: Damian Conway,クイープ出版社/メーカー: オライリー・ジャパン発売日: 2006/08/24メディア: 大型購入: 11人 クリック: 153回この商品を含むブログ (155件) を見る |版 / ページ数|B5版 / 513ページ| |スキャン|白黒 600dpi /(表紙のみ)カラー 300dpi| |圧縮前のサイズ|89.2MB| |圧縮後のサイズ|28.1MB| これは前回のエントリー「ScanSnap S1500 の「OCR テキスト認識」に関する 15 の真実」で調査対象にしたPDF)を、Adobe Acrobat 9(Pro / Standard)を使って圧縮した結果です。*1 前回のエントリーでは、 ScanSnap でスキャンした後に Adobe Acrobat で OCR テキスト認識

    電子化した本に最適!Adobe Acrobat の PDF 圧縮が予想外に便利すぎて鼻血が出たwww - おいちゃんと呼ばれています
  • ScanSnap S1500 の「OCR テキスト認識」に関する 15 の真実 - おいちゃんと呼ばれています

    おっと。また大袈裟なタイトルつけちゃって。 釣り << なんて言われないように、気合い入れて書かなくっちゃ。 さて、先週のエントリー「裁断機 PK-513L でを 100冊裁断してみた - 経験した 9つの失敗とその回避方法」が大きな反響をいただいたので、今回は裁断の次のステップである「スキャン」を攻略。ScanSnap S1500 の設定についていろいろと調べてみました。 *目次というか、いきなり結論から 書いていったら結構長くなってしまったので、とりあえず目次。というかほとんど結論なんですが、結論だけ見られればいいやという方のためにも。 **(2010年7月9日 追記) 自炊した電子書籍PDF)を iPad でサクサク表示する方法(サンプル動画あり) << **(2010年8月13日 追記) OCR テキスト認識に限らず、ScanSnap S1500 の設定全般についてもまとめてみ

    ScanSnap S1500 の「OCR テキスト認識」に関する 15 の真実 - おいちゃんと呼ばれています
  • MOONGIFT: » 無料でPDFのOCR「クセロReader ZERO」:オープンソースを毎日紹介

    うーん、これは凄い。 OCRという技術はフリーでは殆ど見られない(日語では昔あったが、今はない)位、高い専門性と特許が絡んだ難しい技術だ。 それを無料で利用できるというのが素晴らしい。オフィスでも多用されるPDFについて、OCRを適用したければこれを使おう。 今回紹介するフリーウェアはクセロReader ZERO、OCR機能がついたPDFビューワだ。 クセロReader ZEROはタブがついたPDFビューワーで、複数のPDFを閲覧するのに便利なソフトウェアだ。しおりやサムネイルを表示するといった機能もある。 そして最も便利な機能として取りざたされるのがOCR機能だ。試してみた所では多少の誤字認識はあったものの、十分実用レベルだ(PDF中の文字列を検索するという目的には十分)。 さらに画像をクセロReader ZEROにドラッグアンドドロップするだけでPDF化する機能もある。その上でOCR

    MOONGIFT: » 無料でPDFのOCR「クセロReader ZERO」:オープンソースを毎日紹介
  • 1