reCAPTCHA(リキャプチャ)とは、ウェブサイトの制限エリアへのアクセスを試みるボットからサイトを防御するためCAPTCHAを利用するのと同時に、そのCAPTCHAに対する返答を紙の本のデジタル化に活かすシステムである。 オリジナルは2007年にカーネギーメロン大学ピッツバーグ本校にて開発された[1][2]。 2009年9月16日にGoogleはこのテクノロジーを買い取っている[3][4]。 現在reCAPTCHAはニューヨーク・タイムズが持つ記事アーカイブの電子化[5][6][7]及びGoogle ブックス[7]の書籍電子化に利用されている[8]。前者は2009年の時点で、130年分を超えるという全記事のうち約20年分のデジタル化を2、3ヶ月で完了しており[9][10]、残余は2011年末までの完了を目指していた[11]。 reCAPTCHAは、OCRソフトウェアが読み取れなかった文