タグ

ToolとOCRに関するHeavyFeatherのブックマーク (3)

  • MOONGIFT: » 待ちに待ったオープンソースの日本語OCR「NHocr」:オープンソースを毎日紹介

    OCRという技術はアナログなデータをデジタル化する上で欠かすことができない。しかし様々な特許が絡み、オープンソースやフリーウェアとしては発展しづらい分野でもある。しかしそこに風穴を開けられるかも知れない技術が登場しそうだ。 デモサービスで試せます 今回紹介するオープンソース・ソフトウェアはNHocr、日語OCRシステムだ。Google Code上にホスティングされ、まだソースコードは一部しか開示されていないが、デモサービスは公開されている。 デモサービスでは、BMP/JPEG/PBM/PGM/PPMのファイル(さらに各ファイルをGZip圧縮していても可能)をアップロードすると、それを解析した結果を日語表示してくれる。日語OCRとあって、漢字/ひらがな/片仮名/英語などが判別可能になっている。 読み取らせた画像 手書き文字であっても認識率はそこそこ高い。正式リリースがまだという段階にあ

    MOONGIFT: » 待ちに待ったオープンソースの日本語OCR「NHocr」:オープンソースを毎日紹介
  • 脳をバックアップしてくれるツール『EverNote』 | WIRED VISION

    脳をバックアップしてくれるツール『EverNote』 2008年3月18日 IT コメント: トラックバック (5) Scott Gilbertson ユーザーの人生を構成するすべての知識を網羅したデータベース――それが『EverNote』の目指すものだ。 EverNoteは、ユーザーが1日のうちに収集するあらゆるデジタルデータを、重要なものから取るに足らないものまで何でも、中枢のライブラリーに格納してくれるソフトウェア。必要なときにはいつでも瞬時にライブラリーにアクセスできる。 マルチプラットフォームでウェブサービス版もあるEverNoteは、ユーザーが投入したデータを、写真からウェブクリップや手書きのメモまで何でも取り込んでインデックス化してくれる。つまりこれを使えば、ユーザーの人生がたちまち、注釈の付いた、検索可能なものに変身するというわけだ。 保存した理由を思い出せるように、項目に

  • MOONGIFT: » 無料でPDFのOCR「クセロReader ZERO」:オープンソースを毎日紹介

    うーん、これは凄い。 OCRという技術はフリーでは殆ど見られない(日語では昔あったが、今はない)位、高い専門性と特許が絡んだ難しい技術だ。 それを無料で利用できるというのが素晴らしい。オフィスでも多用されるPDFについて、OCRを適用したければこれを使おう。 今回紹介するフリーウェアはクセロReader ZERO、OCR機能がついたPDFビューワだ。 クセロReader ZEROはタブがついたPDFビューワーで、複数のPDFを閲覧するのに便利なソフトウェアだ。しおりやサムネイルを表示するといった機能もある。 そして最も便利な機能として取りざたされるのがOCR機能だ。試してみた所では多少の誤字認識はあったものの、十分実用レベルだ(PDF中の文字列を検索するという目的には十分)。 さらに画像をクセロReader ZEROにドラッグアンドドロップするだけでPDF化する機能もある。その上でOCR

    MOONGIFT: » 無料でPDFのOCR「クセロReader ZERO」:オープンソースを毎日紹介
  • 1