tesseract とは Googleで開発されているOCRエンジンです。(http://code.google.com/p/tesseract-ocr/) とある所要で数字画像の認識エンジンが欲しくなったので、使ってみました。 インストール ports で一発インストール。 # cd /usr/ports/graphics/tesseract/ # make instal clean Mac なら brewで一発インストール。 % brew install tesseract 使ってみる 今回は、数字に限定して認識したかったので、文字種を0-9だけにすることで認識率を上げてみます。 準備するもの 数字の写真 というわけで、とりあえず元素材をぱしゃり。 これを Preview の画像cropを使って、切り取ります。 number.jpg という名前で保存しました。 tiff に変換する 今