タグ

OCRに関するkamipのブックマーク (2)

  • CMLog :: OCRしてみる -nhocr編-

    OCRしてみる -nhocr編- 日語が認識できるエンジンは 手書き文字認識エンジン Tomoe Project Tegaki nhocr - Project Hosting on Google Code あたりがある。下のは日語のプロジェクトもあったりしたけど2009年10月現在日語ですぐに使えなさそうだった。 GOCR ocropus tesseract-ocr - Project Hosting on Google Code そこで、今回はまずnhocrを使って実装してみた。 依存している FreeType Project at SourceForge.net Project-O2 home page から、freetype-2.3.11.tar.gz と O2-tools-2.00.tar.gzを wget [URL] tar zxvf [FILENAME] cd [DIR_

    kamip
    kamip 2011/01/28
  • MOONGIFT: » 待ちに待ったオープンソースの日本語OCR「NHocr」:オープンソースを毎日紹介

    OCRという技術はアナログなデータをデジタル化する上で欠かすことができない。しかし様々な特許が絡み、オープンソースやフリーウェアとしては発展しづらい分野でもある。しかしそこに風穴を開けられるかも知れない技術が登場しそうだ。 デモサービスで試せます 今回紹介するオープンソース・ソフトウェアはNHocr、日語OCRシステムだ。Google Code上にホスティングされ、まだソースコードは一部しか開示されていないが、デモサービスは公開されている。 デモサービスでは、BMP/JPEG/PBM/PGM/PPMのファイル(さらに各ファイルをGZip圧縮していても可能)をアップロードすると、それを解析した結果を日語表示してくれる。日語OCRとあって、漢字/ひらがな/片仮名/英語などが判別可能になっている。 読み取らせた画像 手書き文字であっても認識率はそこそこ高い。正式リリースがまだという段階にあ

    MOONGIFT: » 待ちに待ったオープンソースの日本語OCR「NHocr」:オープンソースを毎日紹介
    kamip
    kamip 2011/01/28
    さりげにすごいな
  • 1