前回に引き続き、オープンソースのOCRエンジンTesseractの開発状況ウォッチング、です。 a244.hateblo.jp 2018年10月の状況 4.0系使用時の注意点 未解決のバグで影響の大きそうなもの #1015 認識結果に関するIssue グレースケール v.s. 二値化画像 PNG形式のアルファチャンネル問題 背景色と圧縮形式による認識結果の変動? まとめ 2018年10月の状況 10/1付けでRC1がリリースされています。 github.com もうすぐ待望のバージョン4.0の正式版が(数々のバグとともに)リリースされそうです。ただ、状況としては未解決のバグがいろいろと存在しており、Help wantedとのこと。「求ム、C++ハッカー」、です。 メンテナの意向としては10月中旬で4.0をリリースしたいらしいです。 Heads up: release of tesserac