タグ

OCRに関するkirara_397のブックマーク (3)

  • MOONGIFT: » 待ちに待ったオープンソースの日本語OCR「NHocr」:オープンソースを毎日紹介

    OCRという技術はアナログなデータをデジタル化する上で欠かすことができない。しかし様々な特許が絡み、オープンソースやフリーウェアとしては発展しづらい分野でもある。しかしそこに風穴を開けられるかも知れない技術が登場しそうだ。 デモサービスで試せます 今回紹介するオープンソース・ソフトウェアはNHocr、日語OCRシステムだ。Google Code上にホスティングされ、まだソースコードは一部しか開示されていないが、デモサービスは公開されている。 デモサービスでは、BMP/JPEG/PBM/PGM/PPMのファイル(さらに各ファイルをGZip圧縮していても可能)をアップロードすると、それを解析した結果を日語表示してくれる。日語OCRとあって、漢字/ひらがな/片仮名/英語などが判別可能になっている。 読み取らせた画像 手書き文字であっても認識率はそこそこ高い。正式リリースがまだという段階にあ

    MOONGIFT: » 待ちに待ったオープンソースの日本語OCR「NHocr」:オープンソースを毎日紹介
  • MOONGIFT: » 無料でPDFのOCR「クセロReader ZERO」:オープンソースを毎日紹介

    うーん、これは凄い。 OCRという技術はフリーでは殆ど見られない(日語では昔あったが、今はない)位、高い専門性と特許が絡んだ難しい技術だ。 それを無料で利用できるというのが素晴らしい。オフィスでも多用されるPDFについて、OCRを適用したければこれを使おう。 今回紹介するフリーウェアはクセロReader ZERO、OCR機能がついたPDFビューワだ。 クセロReader ZEROはタブがついたPDFビューワーで、複数のPDFを閲覧するのに便利なソフトウェアだ。しおりやサムネイルを表示するといった機能もある。 そして最も便利な機能として取りざたされるのがOCR機能だ。試してみた所では多少の誤字認識はあったものの、十分実用レベルだ(PDF中の文字列を検索するという目的には十分)。 さらに画像をクセロReader ZEROにドラッグアンドドロップするだけでPDF化する機能もある。その上でOCR

    MOONGIFT: » 無料でPDFのOCR「クセロReader ZERO」:オープンソースを毎日紹介
    kirara_397
    kirara_397 2007/11/12
    試してみた。正直、OCRの認識率は微妙。
  • レシートリーダーで家計簿を入力 | スラド

    ASCII.jp PC/デジタル の記事によれば、学習研究社の女性向けコミュニティサイト「kurasse」(クラッセ)において、「家計応援くらぶ」が11月1日に開始される(ニュースリリース)。「家計応援くらぶ」では「パソコン用家計簿ソフト」と「レシートリーダー」(OCR用小型スキャナ)が無償提供され、「メンバー専用家計セミナー」などの専用サービスが受けられるようだ。初回募集人数は先着1000名、将来的には2万人まで拡大予定とのこと。興味深いのは独自開発の「レシートリーダー」だ。OCRで商品名、価格、購入店舗などの情報が自動的に取り込める。名刺スキャナのレシート版と理解していいのだろうが、これはいけるかも。

  • 1