タグ

adobeとOCRに関するnakagawaxのブックマーク (1)

  • スキャンしたPDFファイルをOCR化する方法 | スキャンブース

    最近、OCR(スキャナで読み取った書籍の画像をテキストデータとして抽出する技術)についてよく尋ねられます。 スキャンブースでは現在のところ、OCR化出来る環境は提供しておりません。 ですので、基的にはお客様が個々でスキャンしたデータをOCR化していただくことになります。 OCR化のメリットは、スキャナで読み取った書籍の画像をテキストデータとして抽出することにより、PDFからコピーアンドペーストで文章を引っ張れることはもちろん、全文検索が可能になったり、マーカーが引けたりと、まぁ、とても便利になります。 さらに、ファイルの容量も小さくなるので一石二鳥ですね。 ということで、そんなOCR化の手順について簡単にまとめてみました。 今回使用したソフトはAdobe Acrobat X Pro。PDF化ソフトとしては定番のソフトですね。 買うとお高いソフト(もちろんそれだけ高性能なのですが)

    nakagawax
    nakagawax 2012/10/02
    Acrobat ProでのOCR設定方法について。薄い画像は、コントラストを上げて濃くすると、精度があがった。
  • 1