はじめに オライリーのスクレイピングの本を読んでいた時、Tesseract について少し説明があった。 入手可能なオープンソースOCRの中で "最良で最も正確" と書かれていたため、どのくらいの精度が出るものなのか試しに確認してみたので、その時の内容をメモとして残す。 前提条件 【PC環境】 Windows 10 Pro 【SW or Packageのバージョン】 tesseract 5.2.0 Python 3.9.13 pyocr 0.8.3 OpenCV 4.6.0.66 メモ内容 1.Tesseract・pyocr のセットアップ。 2.いくつかの画像パターンで認識精度を確認してみる。 1.Tesseract・pyocr のセットアップ Tesseract のセットアップ 以下のサイトより、Tesseract のインストーラーをダウンロードする。 ※インストールの際にコンポーネント