背景 TesseractはオープンソースのOCRエンジンです。バージョン4.0から深層学習を採用したことで認識精度が大きく上がりました。このTesseractを実務で使ってみて、苦手分野があることが分かりました。 全角英数字 半角カタカナ 手書き文字 今回はこの3つのうち最初の2つの認識精度を上げるため、Tesseractの日本語モデルを再学習させてみます。 なお、手書き文字の再学習についてはTesseract 4.1にLSTMを使って手書き文字を再学習させるにまとめています。 学習方法の選択 LSTMを使ったTesseractの学習方法には大きく分けて2つの方法があります。 新規学習方式 (Training From Scratch):ゼロからモデルを生成する 微調整方式 (Fine Tuning):既存のモデルから転移学習する 新規学習方式は、より多くのイタレーションと学習データが必要
![Tesseract 4.1にLSTMを使って日本語を再学習させる - Qiita](https://cdn-ak-scissors.b.st-hatena.com/image/square/bc1ab8cdbe4aab9a35c4c1af68101bd97286c005/height=288;version=1;width=512/https%3A%2F%2Fqiita-user-contents.imgix.net%2Fhttps%253A%252F%252Fcdn.qiita.com%252Fassets%252Fpublic%252Farticle-ogp-background-412672c5f0600ab9a64263b751f1bc81.png%3Fixlib%3Drb-4.0.0%26w%3D1200%26mark64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTk3MiZoPTM3OCZ0eHQ9VGVzc2VyYWN0JTIwNC4xJUUzJTgxJUFCTFNUTSVFMyU4MiU5MiVFNCVCRCVCRiVFMyU4MSVBMyVFMyU4MSVBNiVFNiU5NyVBNSVFNiU5QyVBQyVFOCVBQSU5RSVFMyU4MiU5MiVFNSU4NiU4RCVFNSVBRCVBNiVFNyVCRiU5MiVFMyU4MSU5NSVFMyU4MSU5QiVFMyU4MiU4QiZ0eHQtYWxpZ249bGVmdCUyQ3RvcCZ0eHQtY29sb3I9JTIzMjEyMTIxJnR4dC1mb250PUhpcmFnaW5vJTIwU2FucyUyMFc2JnR4dC1zaXplPTU2JnM9N2ViZDY3ZjdjY2FiODI4YmJkNjJhNDdlNjAyYjBlOTQ%26mark-x%3D142%26mark-y%3D57%26blend64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZoPTc2Jnc9NzcwJnR4dD0lNDBha2lfYWJla2F3YSZ0eHQtY29sb3I9JTIzMjEyMTIxJnR4dC1mb250PUhpcmFnaW5vJTIwU2FucyUyMFc2JnR4dC1zaXplPTM2JnR4dC1hbGlnbj1sZWZ0JTJDdG9wJnM9ZTRjYTQyMDYzNmRkNmEyZWMzYjRjZDdlMTNkN2RhNGI%26blend-x%3D142%26blend-y%3D486%26blend-mode%3Dnormal%26s%3D73098db3561db6d2ee773c277a3c75b0)