tesseractの学習方法であるScratch TrainingとFine Trainingの手順をまとめました。 以下の公式ページを参考にして書いてます。英語が得意な方はこちらにもお目通しを。(Tesseractバージョン4についての記事ですが、バージョン5でもほぼ同じ手順で学習が可能なことを確認できています。またバージョン5用にコマンドを少し変更しないといけない箇所も存在しますが、本記事内に記載しているのでご安心ください。) https://tesseract-ocr.github.io/tessdoc/tess4/TrainingTesseract-4.00.html tesseract5では画像と正解となるテキストデータでの学習手順が追加されています。本記事で紹介しているのはテキストとフォントデータからの学習方法ですが、画像とテキストでの学習方法も知りたいという方は以下リポジトリ