タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

ocrに関するkohagiのブックマーク (2)

  • Loading...

    kohagi
    kohagi 2009/03/23
  • asahi.com(朝日新聞社):正解率99% ネット認証技術、書籍のデジタル化に威力 - デジタル機器 - デジタル

    正解率99% ネット認証技術、書籍のデジタル化に威力2008年8月23日印刷ソーシャルブックマーク 表示された文字を読み取って入力するreCAPTCHAの画面=カーネギーメロン大提供 古い書籍などをデジタル化しようとすると、文字のにじみや色あせで機械がうまく読み取れないことがある。でも、無数のネット利用者の力を借りると、99%の正確さを達成できた。しかも、使ったのは一見無関係な迷惑メール・迷惑ブログの対策技術――。こんな報告を米カーネギーメロン大の研究チームがまとめ、米科学誌サイエンス(電子版)に掲載された。 書籍のデジタル化は、人が手入力するか、光学式文字読み取り装置(OCR)を使うのが一般的。しかし、OCRでは20%程度の言葉が認識できないとされ、手入力は膨大な時間とコストがかかってしまう。 今回使ったのは、「reCAPTCHA(リキャプチャ)」と呼ばれるプログラム。もとになったのは、

  • 1