El CAPTCHA es un programa que sirve para que una página web valide si quien está accediendo es una persona real o es un ordenador (o también llamado robot).

Seguramente todos hemos visto algún CAPTCHA alguna vez. Los hay de muchos tipos aunque los más comunes son aquellos formados por imágenes ligeramente distorsionadas con caracteres y colores. El funcionamiento es sencillo, hay que introducir el código que aparece en la imagen y así nos permite enviar el formulario que estemos rellenando en ese momento (un registro, validación de datos, etc)

Una curiosidad que mucha gente no conoce, es que con cuando escribimos en algún CAPTCHA estamos contribuyendo a una tarea de digitalización de libros y textos antiguos. Esto ocurre cuando se rellena el CAPTCHA llamado reCAPTCHA, el cual tiene el siguiente formato:


Imagen &<span class=

Los libros, textos, periódicos antiguos, etcétera son escaneados y posteriormente tratados por un programa de reconocimiento de caracteres llamado OCR (Optical character recognition). El problema es que algunos textos no están muy claros cuando son escaneados, y en el momento de la digitalización el software OCR no reconoce algunas palabras siendo imposible realizar la conversión correcta, por ejemplo:

Conversión de un &<span class=

El reCAPTCHA muestra al usuario dos palabras: una palabra de la cual conoce su significado al lado de otra que no conoce (palabra aun no digitalizada). Si el usuario escribe ambas palabras y acierta la conocida, el reCAPTCHA asume que también ha escrito bien la palabra desconocida y de ese modo queda traducida (el CAPTCHA, generalmente, vuelve a mostrar esa palabra desconocida a otros usuarios para asegurarse de la correcta digitalización)


&<span class=
Actualmente el software reCAPTCHA es propiedad de Google. Fue comprado en el año 2009 a la Universidad Carnegie Mellon.