タグ

画像とOCRに関するiwwのブックマーク (4)

  • レシート解析ライブラリ - OCR画像解析 | 事業紹介 | 株式会社アイエスピー

  • IrfanviewでOCRプラグインを使って画像やPDFのテキストを読み取り

    IrfanviewのOCRプラグインで何ができるか Irfanviewで閲覧している画像の中に含まれる文字をテキストデータとして出力することができます。 ただしOCRできるのはダウンロードした言語のみで残念ながら日語のOCRプラグインはありません。 公式サイトからOCRプラグインをダウンロード Irfanviewにはいろいろなプラグインがパックになったセットが用意されていますがその中にはOCRのプラグインは入ってないので自分で公式サイトからダウンロード・インストールしないといけません。 OCRプラグイン「KADMOS ICR/OCR SDK」ダウンロードページはこちら。 ⇒KADMOS / IrfanView 見た目がシンプルすぎるので不安になりますが一応公式サイトのドメインです。 (http://irfanview.info/plugins/kadmos/) 英文をOCRする場合は右側

    IrfanviewでOCRプラグインを使って画像やPDFのテキストを読み取り
    iww
    iww 2017/08/28
    だいぶ誤読み取りが多いけど、無いよりは全然マシ
  • 数独を解く(画像解析) - cuspy diary

    画像として与えられた数独を解きます。 新聞に掲載されていたこの問題をOpenCVを使って画像解析する。(画像が斜めなのはワザとです) グレースケール変換画像解析の前処理として、まずグレースケールに変換し、ガウシアンフィルタをかけてぼかします。ガウシアンフィルタをかける事で、安定した二値化画像が得られます。 二値化次に二値化を行います。 二値化には、普通の方法、大津さんの手法、適応的二値化、などさまざまな手法が在ります。いろいろ試した所、適応的二値化(Adaptive Threshold)が最も数独の認識に適していることが解りました。 適応的二値化(Adaptive Threshold)であれば、影になってしまった部分も上手く処理できます。 膨張処理次に、数独の盤面の外枠を認識を行います。 二値化の影響で枠線が途切れてしまう可能性がありますので、膨張処理(dilate)を行います。 (膨張処

  • 日本語文字認識

    語文字認識 - beta >> English page Since: Oct. 1, 2008 Updated: Jan 13, 2010 このサーバは OCRopusと NHocrを使って 文書画像中の日語文字を認識します。 文字の周囲にゴミや罫線があると認識に失敗します。 横書きの印刷文字のみに対応しています。 認識精度はまだ低いので、ご了承ください。 機密・秘密の画像は絶対に送信しないでください。 (BMP, JPEG, PBM/PGM/PPM, およびそれらのgzipで圧縮されたファイルが読めます。) server spec  | other OCR servers Powered by WeOCR, OCRopus, and NHocr. 日語文字行認識 - beta このサーバは NHocrを使って 文字行画像中の日語文字を認識します。 一行だけの文字列のイメージを

  • 1