タグ

Makeとインストールに関するfukudamasa09のブックマーク (1)

  • Pythonで日本語OCRを行うときのメモ - Qiita

    フリーのtesseractというOCRを使って、pythonで日語のOCRを行うまでに行った手順をまとめます。 環境 Ubuntu 14.04 Python 2.7 インストール tesseractをインストールします。 インストール方針 インストールの方法には、 1. apt-getでインストール 2. ソースからビルド、インストール の二つがあります。 1のapt-getでインストールできるバージョンは3.0.3です。 tesseractで日語を扱うには、日語で訓練されたデータ(jpn.traindata)が必要です。 これは自分でダウンロードしてくる必要があるのですが、ネット上で見つけられたものはver3.0.4のものだけです。3.03でこのデータを使おうとしても、うまくいかず、こんなエラーが出ます。 こちらのかたのように、traindataを編集して3.0.3で使うこともでき

    Pythonで日本語OCRを行うときのメモ - Qiita
  • 1