最近、OCR(スキャナで読み取った書籍の画像をテキストデータとして抽出する技術)についてよく尋ねられます。 スキャンブースでは現在のところ、OCR化出来る環境は提供しておりません。 ですので、基本的にはお客様が個々でスキャンしたデータをOCR化していただくことになります。 OCR化のメリットは、スキャナで読み取った書籍の画像をテキストデータとして抽出することにより、PDFからコピーアンドペーストで文章を引っ張れることはもちろん、全文検索が可能になったり、マーカーが引けたりと、まぁ、とても便利になります。 さらに、ファイルの容量も小さくなるので一石二鳥ですね。 ということで、そんなOCR化の手順について簡単にまとめてみました。 今回使用したソフトはAdobe Acrobat X Pro。PDF化ソフトとしては定番のソフトですね。 買うとお高いソフト(もちろんそれだけ高性能なのですが)