[OpenSource,Mac,Linux] tesseract は Google が提供している OCR ソフトです。日本語には対応していませんが、欧文を処理するときには有用でしょう。 入力フォーマット 標準では無圧縮の TIF ファイルのみの対応です。圧縮された TIF ファイルや、他のフォーマットに対応させるためには、先に libtiff をインストールしておく必要があります。 LibTIFF - TIFF Library and Utilities ダウンロード tesseract-ocr - Google Code ここから、 tesseract-2.xx.tar.gz と、言語ファイル tesseract-2.xx.<lang>.tar.gz をダウンロードします。言語ファイルは最低1つ必要です。多くの場合、英語(tesseract-2.xx.eng.tar.gz)が必要でしょ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く