Seguro que más de una vez te has tenido que registrar en alguna página que te pedía que escribieses unas letras y números sueltos que te mostraban en una imagen. Eso es un Captcha y sirve para que un programa en el ordenador de alguien preparado para registrarse automáticamente un montón de veces en una web no consiga hacerlo. A esos programas se les llaman bots, y cuando se quieren registrar en un sitio así se encuentran con el Captcha, y como no saben ver las letras que les muestran en la imagen, no se pueden registrar. Así se asegura que solo se registran personas, y no PCs automatizados.
Por otra parte, hay programas para reconocer el texto en una imagen. A eso se le conoce como OCR. Es lo que se utiliza al escanear por ejemplo una página de un libro y querer tener el texto para editarlo en Word. Como existen estos programas, los Captchas cada vez deben ser más difíciles y más distorsionados para que realmente solo un humano pueda superarlos.
Actualmente hay en el mundo varios proyectos para digitalizar bibliotecas, que consisten en escanear libros antiguos página por página y a través de un OCR reconocer el texto y dejarlo disponible en páginas webs, PDFs o similares. Es una manera más de extender el conocimiento.
El problema está en que los OCR (programas para reconocer el texto) no están tan avanzados como sería necesario, y siempre hay muchas palabras que no se consiguen reconocer en estos libros que se quiere digitalizar. Ahí es donde está la vuelta de tuerca del asunto. Por un lado tenemos páginas webs generando Captchas, imágenes con texto difíciles de leer para evitar los registros automáticos, y por otro tenemos la digitalización de libros con trozos de texto difíciles de reconocer. Alguien ha tenido una buena idea y los ha unido, generando un proyecto llamado reCaptcha que lo que hace es preparar un sistema para que las páginas webs muestren en sus Captchas trozos de texto que en la digitalización de libros no se han podido interpretar, ayudando así a terminar esos libros.
De 2 problemas obtenemos una solución a ambos. Genial. Cuando las cosas se hacen bien... tonterías las precisas.
Lo conocí a través de... Genbeta
Éste no es de Captchondeo
Escrito el lunes, agosto 27, 2007
Etiquetas: cultureta
Suscribirse a:
Enviar comentarios (Atom)
0 comentarios:
Publicar un comentario