[2015/08/25 20:37] タイトルを修正しました。 懲りずにtesseractネタです。まだまだ続きます。 今回はiOSアプリでtesseract-ocr を使うためのラッパーライブラリ、Tesseract-OCR-iOSについて。 github.com 導入(for Swift) GitHubにあるテンプレートプロジェクトを使うのも一つの方法ですが、CocoaPodsを利用して導入します。 もう8月下旬ですが、Xcode 6.3、Tesseract-OCR-iOSは4.0*1を前提にしてます。 事前準備として対象言語の言語データをダウンロードしておく必要があります(後述)。 Xcodeで新規プロジェクト作成 Xcodeを終了する ターミナルで作成したプロジェクトの存在するディレクトリへ Podfileを作成する(下記参照) ターミナルでpod installを実行 ”プロジェ
今日もtesseract-ocrネタです。当面はブログのネタに困らないように思われます。 [2015/08/28 追記] tesseract-ocr のRuby 用のラッパー(ruby-tesseract-ocr)はまだ3.04に対応していないようです。 Ruby経由でtesseract-ocrを使用している場合は、アップグレードしないほうが無難です。 もしくはGoogle Driveより3.03(rc)をダウンロードしてインストールするのが良いかと思います。下記と同じ要領でインストール可能。 Homebrewでも最新のtesseract-ocr 3.04 がインストールできるようになっています。 しかしながら、肝心のcombine_tessdataコマンドを始めとする言語データ(language data)を扱うコマンドがインストールされません。 そこで、MacOSX (Yosemite
線検出、表検出 † RUNの抽出、とかって書いてある。確立された方法なのか? 表形式文書要素の認識手法に関する研究 http://www.aso.ecei.tohoku.ac.jp/publication_data/217.pdf バブルモデルアルゴリズム フリーハンド罫線抽出アルゴリズムと手書き表認識システム Recognition Algorithm and System for Freehand-drawn Tables http://ci.nii.ac.jp/naid/110002886752 周辺分布を用いた方法 横方向と縦方向へのヒストグラムのようなものを使っている 文書画像のレイアウト構造認識 http://tdl.libra.titech.ac.jp/hkshi/xc/contents/pdf/116685485/6 2.3.2. 罫線抽出 罫線抽出は,表画像の中から罫線と
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く