31 de agosto de 2012

Privacidad, cookies y estadísticas

Chromium incognito otr icon fullscreen.png

No me gusta que me espíen. No porque me dedique a actos ilegales sino porque prefiero tener la libertad de escoger compartir mis actividades con quien yo elija.

Hay que reconocer que en el mundo físico resulta complicado espiar a los ciudadanos a gran escala, siendo algo que solo tiene lugar generalmente en los regímenes totalitarios, aunque los avances tecnológicos permiten un control mucho más orwelliano.

HONDA ASIMO.jpg

Sin embargo, en la red la situación es muy distinta. No se puede tener a un robot siguiendo a cada ciudadano, pero cualquier gran compañía analiza muy cuidadosamente el perfil de los usuarios que visitan su web.

Especialmente “problemáticas” son las grandes compañías que ofrecen servicios —como anuncios— en una amplio conjunto de internet, debido a su capacidad de seguir la trayectoria del usuario a lo largo de múltiples páginas, generando un perfil del usuario. Aficiones, rango de edad, área geográfica, temas de interés... Esto es invariablemente justificado para «mejorar la experiencia del usuario» y ofrecerle información (ie. los productos anunciados) más relevante (que esté más dispuesto a comprar).

Si bien hay sitios claramente definidos por su funcionamiento como sistemas de recomendación, como Last.fm, la mayoría de estas actividades se realizan de espaldas al usuario o escondido en unos términos de uso que no están diseñados para el usuario. Los internautas por su parte, reciben estos seguimientos con desconfianza, cayendo en ocasiones en el alarmismo.

Aparte de para trazar un perfil de usuario y generar anuncios basados en su comportamiento previo, las cookies también tienen otros fines.

Son necesarias por ejemplo para que funcionen de forma segura a sitios web que requieren el uso de una sesión, como son todos aquellos donde el usuario accede con un registro.

Una variante reciente de los anunciantes siguiendo a los usuarios en sus visitas, es la proliferación de accesorios de redes sociales, que permiten compartir la página con los contactos, listan los amigos a los que les gusta la página o simplemente muestran información de la página asociada a la misma.

Son un híbrido al ofrecer un servicio adicional que pretende ser útil para los usuarios (al contrario que los anuncios, vistos como un mal necesario), pero por otro lado permiten un seguimiento mucho mayor, al poder cruzar todos los datos de visitas con la información del perfil de este y de sus amistades.

Y finalmente, las cookies también son utilizadas para el propio seguimiento del usuario dentro del sitio, con objetivos que van desde mejorar la usabilidad de la página como medir la efectividad de los anuncios situados en diferentes medios externos a la hora de atraer usuarios.

En Wikimedia España somos una asociación con el fin de promover el conocimiento libre, al estar formada por usuarios, tenemos una visión —y por ende actitudes— mucho más cercana al del usuario, puesto que somos precisamente, ante todo, usuarios. Esto lleva a que hayamos ignorado por largo tiempo todos estos asuntos de quién-me-visita, cómo-son-mis-usuarios, qué-programa-de-TV-prefieren.

El producto que “vendemos” es un bien intangible. No ganamos dinero con cada visita ni tenemos anuncios en los buscadores publicitando nuestras maravillas. Más aún, nunca he mirado dónde aparece nuestra web en los resultados de búsqueda según palabras clave (aunque confío en que hagan un buen trabajo) ni qué PageRank tenemos.

Reconozco que el servidor web guarda un registro de las peticiones, pero en realidad no lo tratamos. En los últimos meses ha sido consultado en 4 ocasiones, todas ellas relacionadas con determinar el origen de spam a nuestra web. Remontándonos más en el tiempo, creo que solo analizamos las visitas en una única ocasión, para determinar las visitas que tuvimos al finalizar el concurso Wiki Loves Monuments 2011.

Wiki Loves Monuments Logo notext 2012.png

Ahora mismo, nos encontramos en la misma situación, a las puertas de Wiki Loves Monuments 2012. Una cosa es ignorar las decenas de visitas diarias que tengamos (que serán principalmente robots) y otra formar parte de un concurso mundial con cientos de participantes (casi 800 el año pasado en la fase española) y no poder evaluar el impacto en absoluto.

Resulta interesante saber cuánta gente visitó la página no solo para hacer autoanálisis, sino también a la hora de obtener patrocinadores para futuras ediciones (no reciben la misma visibilidad en una página con miles de visitas que con cientos miles), para los patrocinadores internacionales y el propio equipo internacional del concurso.

El año pasado estimamos unas 140 000 visitas, aunque no tenemos datos completos. La estimación está basada en los valores (incompletos) de registros del servidor y en los datos (también incompletos) de Google Analytics.

Con el fin de minimizar las inquietudes sobre la privacidad de usar Google Analytics, Wikimedia Nederland ha ofrecido en uno de sus servidores para todos los países participantes una instalación de Piwik, una alternativa libre para el análisis web.

Analizada la necesidad de estadísticas y lo que nos ofrece esta solución, hemos decidido aceptarla, a pesar del inconveniente de estar vigilando a los usuarios. A partir de hoy las visitas a la web de Wiki Loves Monuments España notificarán al servidor de estadísticas para Wiki Loves Monuments y se almacenará una cookie para diferenciar las visitas nuevas de las revisitas.

Aunque no consideramos ese servidor un tercero, el script está igualmente configurado para respetar la cabecera Do Not Track. Si el navegador está configurado para solicitar no ser seguido (configurar en Firefox, Internet Explorer, Safari), no enviará la información al servidor de Wiki Loves Monuments, ni almacenará cookies (borrándolas si hubiese alguna establecida). Creo que es la forma más cómoda de permitir a los usuarios desactivar esta característica, sin tener que recurrir a interfaces molestos. Estamos de todos modos abiertos a sugerencias de otras alternativas.

La información que se recopile quedará entre los organizadores de Wiki Loves Monuments España y Wiki Loves Monuments Internacional. Publicaremos datos resumidos, pero de forma agregada, de modo que no revele información personal de nadie. Por «datos agregados que no afectan a la privacidad» me refiero a: número de visitantes totales, porcentaje de visitas por país (podríamos detallarlo para España a 'visitas por provincia', si los datos son de calidad y con suficiente variación), visitas por proveedor, navegadores / sistemas operativos utilizados, distribución de las visitas a lo largo del tiempo y otras agrupaciones similares.

1 comentario:

  1. felicidades por este acto de transparencia. Y suerte con Wiki Loves Monuments 2012!

    ResponderEliminar