タグ

ブックマーク / user.ecc.u-tokyo.ac.jp/~ll087050 (1)

  • OpenSource/tesseract - ll087050

    [OpenSource,Mac,Linux] tesseract は Google が提供している OCR ソフトです。日語には対応していませんが、欧文を処理するときには有用でしょう。 入力フォーマット 標準では無圧縮の TIF ファイルのみの対応です。圧縮された TIF ファイルや、他のフォーマットに対応させるためには、先に libtiff をインストールしておく必要があります。 LibTIFF - TIFF Library and Utilities ダウンロード tesseract-ocr - Google Code ここから、 tesseract-2.xx.tar.gz と、言語ファイル tesseract-2.xx.<lang>.tar.gz をダウンロードします。言語ファイルは最低1つ必要です。多くの場合、英語(tesseract-2.xx.eng.tar.gz)が必要でしょ

  • 1