こんにちは、tomita です。 さて、免許証の写真から住所や名前などのテキストを抽出できるスマホアプリがあるそうです。 OCRの技術を使ったものだと思うのですが、ちょっと調べたところ、tesseract-ocr というオープンソースの OCR エンジンがあったので、少し触ってみました。 環境は CentOS 6.3 です。 前準備 以下のライブラリを yum install しておきます。 yum install autoconf automake libtool yum install libpng-devel libjpeg-devel libtiff-devel zlib-devel Leptonica という画像解析ライブラリも必要なので、ソースインストールしておきます。 cd /usr/local/src/ wget http://leptonica.googlecode.co