Wikidata: cómo hacemos Wikipedia un poco más inteligente

Durante la última Wikimanía tuvo lugar una serie de presentaciones acerca de diversos avances en los diferentes ámbitos del movimiento Wikimedia: métricas, colaboración y proyectos que permiten comprender y mejorar las relaciones entre los editores. Muchos de estos avances se han centrado en cómo los lectores -los usuarios que no editan- consumen la Wikipedia en el día a día, y se ha determinado que uno de los mejores avances ha sido la creación de Wikidata, un repositorio de datos abiertos.

Hace más de dos años, Wikimedia Deutschland (Wikimedia Alemania), comenzó a desarrollar una idea que permite unificar la información (metadatos esencialmente) de todas las Wikipedias en una sola base de datos central: fue bautizado como Wikidata. Los avances que ha tenido en los últimos años han sido sorprendentes, hasta el punto que Freebase, el proyecto libre de Google, decidió cerrar sus puertas para pasar el testimonio a Wikidata.

Actualmente Wikidata ya ha alcanzado un nivel bastante avanzado de desarrollo, donde los millones de objetos creados ya dan cuenta de que hemos podido migrar la información a este proyecto, y que Wikipedia ya ha comenzado a utilizarlos en forma positiva.

En Wikipedia

Un ejemplo del uso en Wikipedia se puede ver en la plantilla ficha de persona. Esta plantilla se encarga de crear la caja lateral con información breve de la persona biografiada. Tras varios meses de esfuerzo, ya se han comenzado a usar datos desde Wikidata permitiendo ahorrar tiempo y el esfuerzo de completar los parámetros, para así mantener unificada la información básica del biografiado en todas las versiones de Wikipedia.

image001

En este ejemplo se delega el control de la información que contiene la ficha lateral a Wikidata, ya que una vez que existe en el repositorio, basta con usarla en la ficha sin la necesidad que deba ser ingresada nuevamente en cada proyecto local.

SPARQL: obtener listados

Como este proyecto tiene su génesis en la web semántica, también posee un endpoint (Wikidata Query Service) donde los usuarios más experimentados pueden extraer información o combinar con otros endpoints para obtener mayor valor con los intercambios de información.

El servicio de consultas, que es compatible con SPARQL 1.1, permite extraer básicamente listados de información para trabajarlos localmente, o simplemente para responder a dudas e inquietudes acerca de determinados cruces de datos que sería imposible realizar normalmente en Wikipedia.

Un ejemplo de esto último: he trabajado en los últimos meses en la vinculación de los ganadores del premio de literatura infantil y juvenil de España con los escritores ganadores en Wikidata. Como una curiosidad general, decidí obtener el listado de ganadores y la edad que tenía la persona al obtener el premio (aquí está la consulta) -el más joven en recibirlo fue Fernando Martínez Gil, mientras la persona de mayor edad fue Carmen Conde-. Este listado, sin la existencia de estos datos en Wikidata, es un trabajo que exige mucho tiempo, debido a que requiere consultar a todos los galardonados y calcular cuántos años tenían al momento de ganar el premio.

Aplicación móvil

Esta forma de construir de Wikidata ha permitido que, a partir de la aplicación móvil de Wikipedia, se tenga un pequeño extracto antes de consultar el dato, una fotografía en la cabecera y que los artículos relacionados sean más inteligentes. Por ejemplo, al buscar un texto en la aplicación de Wikipedia, este es un ejemplo de los posibles resultados:

image003

Donde en rojo es una imagen descriptiva, en este caso los logotipos, y en verde es una breve descripción del elemento: ambos metadatos provienen de Wikidata. Al acceder a un elemento, en este caso, Rede Globo, la imagen de logotipo ocupa la cabecera y el texto descriptivo ocupa la parte inferior de dicha imagen:

image005

La ventaja de este tipo de uso es que si se intenta consultar por este artículo en otro idioma -y si existe-, siempre se verá el logo y la descripción que provienen desde Wikidata.

Por tanto, el uso de Wikidata como repositorio central ha contribuido a mejorar Wikipedia y disponer de más y mejores herramientas para descubrir la información que contienen los artículos, generar la información de resumen de cada artículo, y poder darle más  inteligencia para que todos podamos encontrar nuevos conocimientos a partir de estos datos.

Dennis Tobar.
Socio de Wikimedia España.