タグ

プログラミングとOCRに関するiwwのブックマーク (2)

  • 日本語OCRによる文字認識 ~WPFなどの.NET FrameworkアプリやUWPアプリからWindows 10のOCRエンジンを使う

    ※適用バージョン:Windows 10 version 1507(build 10240)以降 はじめに OCR機能を組み込めたら、どんなアプリが作れるでしょう? 名刺や葉書からデータを取り込む住所録アプリ レシートや領収書などからデータを取り込む家計簿アプリ 印刷された書類などをテキストデータ化するアプリ 商品名を読み取って通販サイトを検索するアプリ 電柱などの住所表示を読み取って現在地を検索するアプリ いろんなアプリのアイデアが浮かんでくることでしょう。でも、市販されている日語OCRライブラリは、けっこうなお値段がするので、個人開発者のレベルではちょっと使いにくいのです。そのようなライブラリは、辞書を使って読み取り精度を高めていたり、帳票の罫線を認識して誤認識を減らす工夫がしてあったりと、魅力的ではあるのですが。あるいは、最近になってメジャーどころも参入してきたOCRのWebサービス

    日本語OCRによる文字認識 ~WPFなどの.NET FrameworkアプリやUWPアプリからWindows 10のOCRエンジンを使う
  • 数独を解く(画像解析) - cuspy diary

    画像として与えられた数独を解きます。 新聞に掲載されていたこの問題をOpenCVを使って画像解析する。(画像が斜めなのはワザとです) グレースケール変換画像解析の前処理として、まずグレースケールに変換し、ガウシアンフィルタをかけてぼかします。ガウシアンフィルタをかける事で、安定した二値化画像が得られます。 二値化次に二値化を行います。 二値化には、普通の方法、大津さんの手法、適応的二値化、などさまざまな手法が在ります。いろいろ試した所、適応的二値化(Adaptive Threshold)が最も数独の認識に適していることが解りました。 適応的二値化(Adaptive Threshold)であれば、影になってしまった部分も上手く処理できます。 膨張処理次に、数独の盤面の外枠を認識を行います。 二値化の影響で枠線が途切れてしまう可能性がありますので、膨張処理(dilate)を行います。 (膨張処

  • 1