Google製のオープンソースTesseract OCRを試したいと思う。 まず、インストールの前に、4つのライブラリが必要なようなので、 あらかじめインストールしておく。 # yum install libpng-devel # yum install libjpeg-devel # yum install libtiff-devel # yum install zlib-devel Tesseract OCRをダウンロードしてインストールする # # wget http://tesseract-ocr.googlecode.com/files/tesseract-3.00.tar.gz # tar -xvzf tesseract-3.00.tar.gz # cd tesseract-3.00 # ./configure # make # make install 日本語データをインスト
![オープンソースのOCR、Tesseract OCRを試してみる | TRYOUT PRJ.](https://cdn-ak-scissors.b.st-hatena.com/image/square/de67e825448b50455eeb9021223cb72ba61830b4/height=288;version=1;width=512/https%3A%2F%2Fnewbienewbie.files.wordpress.com%2F2011%2F04%2Focr2.jpg%3Fw%3D224)