前回の続きです. 今回はPythonでtesseractを使い,OCRをしてみるところまで挑みたいと思います. OCR(工学文字認識)そのものについては前回書いたので省略します. teru0rc4.hatenablog.com tesseract tesseractのインストール tesseractとはGoogleで開発されているOCRエンジンです. homebrewを使いインストールします(homebrewについては過去に記事書いているのでご参照下さい) $ brew install tesseract みょろみょろログが出て,インストール完了です. 実は最初の状態だと英数字にしか対応していません. ので,次節にて日本語対応させたいと思います. その前に,現在のtesseractのバージョンと,対応言語の確認をして起きたいと思います. バージョンの確認は $ tesseract -v か
![Python3系でtesseractを使ってOCRをやってみる - しゃちの備忘録](https://cdn-ak-scissors.b.st-hatena.com/image/square/dfa5ef38b4f206d5904ac12f68c497508b66dc2d/height=288;version=1;width=512/https%3A%2F%2Fcdn-ak.f.st-hatena.com%2Fimages%2Ffotolife%2Ft%2Fteru0rc4%2F20170721%2F20170721165955.png)