タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

cloudsourcingとocrに関するtvskのブックマーク (1)

  • reCAPTCHA - Wikipedia

    reCAPTCHA(リキャプチャ)とは、ウェブサイトの制限エリアへのアクセスを試みるボットからサイトを防御するためCAPTCHAを利用するのと同時に、そのCAPTCHAに対する返答を紙ののデジタル化に活かすシステムである。 オリジナルは2007年にカーネギーメロン大学ピッツバーグ校にて開発された[1][2]。 2009年9月16日にGoogleはこのテクノロジーを買い取っている[3][4]。 現在reCAPTCHAはニューヨーク・タイムズが持つ記事アーカイブの電子化[5][6][7]及びGoogle ブックス[7]の書籍電子化に利用されている[8]。前者は2009年の時点で、130年分を超えるという全記事のうち約20年分のデジタル化を2、3ヶ月で完了しており[9][10]、残余は2011年末までの完了を目指していた[11]。 reCAPTCHAは、OCRソフトウェアが読み取れなかった文

    reCAPTCHA - Wikipedia
    tvsk
    tvsk 2014/07/17
    CAPTCHAの発展版。そもそものボット避けの目的の他に、「CAPTCHAに対する返答を紙の本のデジタル化に活かすシステム」
  • 1