reCAPTCHA计划是由卡内基梅隆大学所发展的系统,主要目的是利用CAPTCHA技术来帮助典籍数字化的进行,这个计划将由书本扫描下来无法准确的被光学文字辨识技术(OCR, Optical Character Recognition)识别的文字显示在CAPTCHA问题中,让人类在回答CAPTCHA问题时用人脑加以识别[1]。reCAPTCHA正数字化《纽约时报》(New York Times)的扫描存盘[2],目前已经完成20年份的数据,并希望在2010年完成110年份的数据。
为了验证人类所输入的文字是正确的,而不是随意输入,有两个字会被显示出来;一个是光学文字辨识软件无法辨别的字,另一个是一个已经知道正确答案的字。如果用户正确的回答出已知正确答案的字,那么就假设所输入的另一个光学辨识软件无法辨识的字是认真的查看后被输入而非随便输入。[4][5]
reCAPTCHA问题的所需的文字图片,首先会由reCAPTCHA计划网站利用Javascript API取得[6],在最终用户回答问题后,服务器再连回reCAPTCHA计划的主机验证用户的输入是否正确。reCAPTCHA计划提供了许多编程语言的库,让集成 reCAPTCHA服务到现有程序的过程可以轻松些。除非有较大的带宽需求,否则reCAPTCHA原则上是一个免费的服务。[7]
http://zh.wikipedia.org/zh-cn/ReCAPTCHA