日本語OCRを作ったので詳しく解説してみる GitHub↓で公開中。 https://github.com/tanreinama/OCR_Japanease 日本語OCRとは 文字通り日本語のOCRです。OCRとは、画像から文字を認識するプログラムです。 前回の記事 https://qiita.com/tanreinama/items/e171449e66d5221afe7e 使用するニューラルネットワーク このOCRプログラムのメインは、基本的にはディープラーニングによって作成されたニューラルネットワークの実行です。 OCRに必要となるのは、文章領域・文字の検出用と、文字のクラス分類用の二つのニューラルネットワークです。 Center Line Detection まず、OCRでは、画像中にある文字を全て取り出せば、それで良いわけではありません。 文字は繋がって文章となり、ひとまとまりの