Google製のオープンソースTesseract OCRを試したいと思う。 まず、インストールの前に、4つのライブラリが必要なようなので、 あらかじめインストールしておく。 # yum install libpng-devel # yum install libjpeg-devel # yum install libtiff-devel # yum install zlib-devel Tesseract OCRをダウンロードしてインストールする # # wget http://tesseract-ocr.googlecode.com/files/tesseract-3.00.tar.gz # tar -xvzf tesseract-3.00.tar.gz # cd tesseract-3.00 # ./configure # make # make install 日本語データをインスト