7月22 文字認識(その2) カテゴリ:tesseract-ocr 今回はtesseracrt-ocr の認識率をあげるやめ、トレーニングを行ってみる。 前回はC++での開発に必要となるライブラリのみをダウンロードしたのだが、トレーニングを行うためにはツール類が必要となるため、セットアップからインストールし直すことにする。セットアップ tesseract-ocr-setup-3.02.02.exe が、前回と同じく以下のページからダウンロードできる。 https://code.google.com/p/tesseract-ocr/downloads/list セットアップを実行すると、デフォルトでは「C:\Program Files (x86)\Tesseract-OCR」にインストールされる。インストール先は環境変数にも TESSDATA_PREFIX として登録される模様。このフォルダ