[B! cloudsourcing][ocr] tvskのブックマーク

tvsk id:tvsk

cloudsourcingとocrに関するtvskのブックマーク (1)

reCAPTCHA - Wikipedia
reCAPTCHA（リキャプチャ）とは、ウェブサイトの制限エリアへのアクセスを試みるボットからサイトを防御するためCAPTCHAを利用するのと同時に、そのCAPTCHAに対する返答を紙の本のデジタル化に活かすシステムである。オリジナルは2007年にカーネギーメロン大学ピッツバーグ本校にて開発された[1][2]。 2009年9月16日にGoogleはこのテクノロジーを買い取っている[3][4]。現在reCAPTCHAはニューヨーク・タイムズが持つ記事アーカイブの電子化[5][6][7]及びGoogle ブックス[7]の書籍電子化に利用されている[8]。前者は2009年の時点で、130年分を超えるという全記事のうち約20年分のデジタル化を2、3ヶ月で完了しており[9][10]、残余は2011年末までの完了を目指していた[11]。 reCAPTCHAは、OCRソフトウェアが読み取れなかった文
tvsk 2014/07/17
CAPTCHAの発展版。そもそものボット避けの目的の他に、「CAPTCHAに対する返答を紙の本のデジタル化に活かすシステム」

ocr

machine learning

cloudsourcing
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx