前回の続きです. 今回はPythonでtesseractを使い,OCRをしてみるところまで挑みたいと思います. OCR(工学文字認識)そのものについては前回書いたので省略します. teru0rc4.hatenablog.com tesseract tesseractのインストール tesseractとはGoogleで開発されているOCRエンジンです. homebrewを使いインストールします(homebrewについては過去に記事書いているのでご参照下さい) $ brew install tesseract みょろみょろログが出て,インストール完了です. 実は最初の状態だと英数字にしか対応していません. ので,次節にて日本語対応させたいと思います. その前に,現在のtesseractのバージョンと,対応言語の確認をして起きたいと思います. バージョンの確認は $ tesseract -v か