PaddleOCRについて Deep Learningを使ったOCRです。Baiduが開発しているようで、軽量(lightweight)を売りにしています。 論文はこちらで確認できます。 2020年の9月ごろに耳にしまして、簡単に触れるような手引きやDockerイメージ等が充実していることもあり、試してみることにしました。 日本語にも対応しています。先に申しますと日本語のOCRに少し苦戦したので、このように記事として残しておきます。 導入 GitHubにある説明の通りです。リンクからご参照ください。本記事ではDockerを使い、かつ手っ取り早くCPUで動かすことにします。 sudo docker run --name ppocr -v $PWD:/paddle --network=host -it hub.baidubce.com/paddlepaddle/paddle:latest-gp