はじめに tesseractでOCRする際、文書画像をそのまま入力するより、行単位で入力した方が読み取り精度が高い事を確認しました。 nsr-9.hatenablog.jp 前回の実験では手動で行を切り出していたので、今回はそれを自動で行えるようにします。 Haar-Like(Like)を用いた行の検出 テキスト行の検出は、白線検出で使ったHaar-Like(Like)特徴量を用います。 nsr-9.hatenablog.jp 上下で白と黒に別れたマスクパターンを文書画像の縦方向に走査することで、行とブランクを検出することができます。 import numpy as np import sys import cv2 def calc_haarlike(crop_img, rect_h): pattern_h = rect_h // 2 height = crop_img.shape[0]