pycorに必要なモジュールをインポートします。 ここではpyocrと画像を読み込むためにPIL(PythonImagingLibrary)の Imageモジュールをインポートします。 from PIL import Image import pyocr pyocrが利用可能か確認します。 tools = pyocr.get_available_tools() tool = tools[0] print(“Will use tool ‘%s'” % (tool.get_name())) 「Will use tool ‘Tesseract (sh)’」と出力されれば問題ないですが 「list index out of range」のエラーが出力された際はtesseractが正常にインストールされていない可能性があります。 pyocrによる画像からテキストの抽出 次にテキストを抽出したい画像を
![【Colab】pyocrで画像からテキストを抽出しよう](https://cdn-ak-scissors.b.st-hatena.com/image/square/a24480012b8015bc0b91dd04b7189ab7f7f6709a/height=288;version=1;width=512/https%3A%2F%2Fwww.teamxeppet.com%2Fmemorandum%2Fwp-content%2Fuploads%2F2021%2F07%2F9a577001d704dd4c895670f1637baf30.png)