rubyで画像上の文字を取得するOCRをやってみした。 OCRのライブラリとしてtesseract-ocrを利用します。 なので、まずはtesseract-ocrを導入する必要があります。 環境は、CentOS6の場合です。 まず必要となるものをyumで入れておきます。 yum -y install autoconf automake libtool yum -y install libpng-devel libjpeg-devel libtiff-devel zlib-devel そしてLeptonica という画像解析ライブラリが必要なようなので、これをダウンロードしてコンパイルします。 wget http://leptonica.googlecode.com/files/leptonica-1.69.tar.gz tar xvzf leptonica-1.69.tar.gz cd l