Confidare Weblog

Cómo NO Proteger Direcciones de E-Mail en la Web

por jcataldo el Jun.26, 2005, bajo Ingeniería de Software, Universidad

En una institución del tamaño y nivel de uso de tecnología de la UTFSM, es indispensable contar con un sistema de información para determinar rápidamente los datos de contacto de cada una de las personas que le conforman, incluyendo su nombre completo, número de anexo telefónico y dirección de correo electrónico.

La necesidad de contar con esta información se contrapone a la de protegerla de los spammers, que cuentan con programas (harvesters) que recolectan la información para sus bases de datos recorriendo las páginas WWW del mundo. Como en toda situación en la cual existen posiciones contrapuestas, este tema ha sido tema de debate y controversia en lo relativo a aspectos que van desde la técnica hasta la ética.

El hecho central del tema consiste en que cualquier dirección de e-mail publicada en claro en la WWW (como jcataldo@inf.utfsm.cl) irá a parar, tarde o temprano, a las bases de datos de los spammers, dado que los harvesters analizan el código HTML de las páginas buscando patrones de texto que tengan forma de direcciones de correo. Esta situación debe ser considerada en la confección de un directorio de personas.

Una estrategia simple para enfrentar el problema consiste en la utilización de imágenes (típicamente generadas en forma dinámica) que tienen escrita la dirección de correo del caso. Se espera así burlar a los harvesters y al mismo tiempo satisfacer las necesidades de información del usuario. Por ejemplo, la inclusión de la siguiente imagen no requiere el uso de la expresión “jcataldo@inf.utfsm.cl” en ninguna parte del código HTML. Siéntase libre de pesquisar el código HTML y/o abrir la imagen (clic derecho, “Ver Imagen”) para ver que el texto no aparece ni siquiera en la URL (http://personas.confidare.cl/blog/wp-content/gallery/usm/email.png).

Recuerdo haber sido testigo de críticas a la DCSC, por cuanto las direcciones de e-mail de todos los integrantes de la UTFSM aparecían en claro en el directorio de personas. Hoy tuve una grata sorpresa al advertir que el sistema ha sido modificado para entregar las direcciones a través de una imagen. De hecho, ejecuté una consulta para buscar mi apellido en el directorio de alumnos y vi que no sólo se protege la dirección de e-mail, sino además los nombres y apellidos. Y por si fuera poco, sendos mensajes intimidan a cualquiera que quiera extraer la información por medios humanos, y explican que esa es la razón por la cual se entrega en “formato de imagen”.

screenshot del directorio

¡Perfecto! Por fin un trabajo bien hecho, me dije. Sin embargo, con morbosa curiosidad hice clic derecho sobre mi dirección () y elegí “Ver Imagen”. Con una mezcla de horror y repulsión, advertí que la URL es:

    http://www.alumnos.utfsm.cl/indice/email.php?text=juan.cataldo@alumnos.usm.cl

¿Verdaderos genios, cierto? La codificación en imagen en este caso no sirve de nada, dado que los harvesters obviamente analizan no sólo lo visible, sino todo el contenido de la página HTML (incluyendo URLs). Puedo imaginarme la instrucción que le dieron a quien implementó esta modificación:

— Oye, hay que cambiar el directorio para que muestre los e-mails mediante imágenes.
— Pero, ¿Por qué?
— No importa, sólo hazlo. Y por preguntón, incluye también los nombres y apellidos.

Al menos toda esta desafortunada situación tiene un lado positivo, puedo entretenerme desde aquí incluyendo imágenes obtenidas desde el sitio de ellos:


6 Comentarios

Escribe un comentario