はじめに 自前でOCR機能を開発しようと思ったら、OCRライブラリとしては現状 Tesseract-OCR 一択かなと思います。 もっと素晴らしいライブラリあったら知りたいなぁと思いますが、 OCRについて調査した5〜6年前から現在に至るまで、OCRの分野で劇的なブレイクスルーは感じていません...。 Tesseract-OCRには、公式?から各言語の一般的に利用できる学習データが公開されています。 しかしながら、この汎用的な学習データをそのまま使っても、自分が利用したい「固有の用途」にはイマイチなことがほとんどかと思います。 例えば... 検出したい内容が限られている、業務上の何らかの文字列のOCR 特定のフォントの特定の文字列だけでいいOCR ある特殊なフォントに対応するだけでいいOCR ある特定人物の手書き文字のOCR ...etc 自分が欲するOCR学習データを作成してしまいましょ