タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

DigitizationとOCRに関するsconvictのブックマーク (2)

  • OCRからOWRへ - 電子化

    日のお題: wordFromDictionary="false" さて、新年なので話題を変えて、OCRについて進めていきましょう。 OCRというのは、名、Optical Character Recognitionですので、その名前が示すとおり、文字(Character)単位の認識(Recognition)をしていきます。ところが、こんなことを額面どおりに行っているソフトは、おもちゃOCRだけです。 ちゃんとしたOCRは、OCRという名前がついていても、実は、OWRとなっていて、Optical Word Recognitionという感じで、単語(Word)単位の認識(Recognition)をしていきます。 分かりやすくするために、例で見て行きましょう。 前(http://d.hatena.ne.jp/denshikA/20091010)にも書きましたが、OCRというのは、EとB、CとO

    OCRからOWRへ - 電子化
  • CA1718 – 動向レビュー:電子化の現場からみたOCRの動向 / denshikA

    電子化の現場からみたOCRの動向 1. はじめに  インターネットを通じて、自宅や職場などから閲覧できるが増えている。あるものは無料で、あるものは有料で閲覧することができる。電子化されたがインターネット上で公開される利点は、いつでも/どこでも読むことができるということだけではない。これまで目当てのを探そうとすると、タイトル、著者名、分類などを頼りに探すしかなかったが、電子化されたは、その中の文章や内容の一部からでも検索可能となる。つまり、インターネット上に電子化されたが公開されると、の探し方/使い方が変わる、と言える。この新しい「の探し方/使い方」を陰で支えているのが「光学式文字読取装置」(Optical Character Reader:OCR)というテクノロジーである。稿では、や新聞の電子化に携わる者(1)の視点で、OCRの動向を紹介する。 2. OCRはどのように使

    CA1718 – 動向レビュー:電子化の現場からみたOCRの動向 / denshikA
  • 1