Objetos culturales y metadatos: hacia la liberación de datos en Wikidata

Generalmente, los proyectos de desarrollo GLAM se asocian a la liberación de materiales textuales, gráficos o sonoros, que se ponen a disposición de todos los posibles usuarios, bajo licencias libres, sin que existan cortapisas para su reaprovechamiento y uso, sea comercial o no.

Sin embargo, en los próximos años se va a apreciar un creciente número de proyectos que van a acompañar la liberación de contenidos con la liberación de los datos semánticos correspondientes. Y es que las obras culturales, en el entorno digital, no son nada si no van acompañadas de su correspondiente conjunto de metadatos. Europeana lo tuvo claro desde sus mismos inicios: el potencial de uso y reaprovechamiento del patrimonio cultural debía basarse en la publicación y reutilización de los datos semánticos de los objetos, y de los esquemas de datos necesarios para su interpretación. Wikipedia ha desarrollado desde 2012 Wikidata, «una base de datos secundaria libre, colaborativa y multilingüe, que recopila datos estructurados para dar soporte a Wikipedia…». El uso de Wikidata crece exponencialmente: es el origen de los grafos que Google presenta como fichas destacadas en sus respuestas, y de la mayoría de las infoboxes de los artículos de Wikipedia. Por definición, Wikidata trabaja con open data, lo que hace posible la reutilización de datos sin limitaciones.

Al hilo de todo esto, los museos flamencos han sido de los primeros en iniciar un proyecto de integración y aportación de los datos de unos 25.000 objetos culturales de sus colecciones a Wikidata. El proyecto Flemish art collections, Wikidata and Linked Open Data, iniciado en 2015, es coordinado por el PACKED vzw (Expertisecentrum Digitaal Erfgoer), y en él participan cuatro wikimedistas expertos, seis museos, y dos colecciones virtuales. Como uno de los resultados entregables del proyecto, los participantes publicaron en octubre de 2015 un whitepaper que es el objeto de estos párrafos.

Fauconnier, Sandra; Lemmens, Bert; Direickx, Barbara (2015). Wikidata: Flemish art collections, Wikidata and Linked Open Data/Whitepaper. Disponible en: https://www.wikidata.org/wiki/Wikidata:Flemish_art_collections,_Wikidata_and_Linked_Open_Data/Whitepaper [Consulta: 29/03/2016].

Fauconnier, Sandra; Lemmens, Bert; Direickx, Barbara (2015). Wikidata: Flemish art collections, Wikidata and Linked Open Data/Whitepaper. Disponible en: https://www.wikidata.org/wiki/Wikidata:Flemish_art_collections,_Wikidata… [Consulta: 29/03/2016].

El documento se estructura en cuatro partes principales y un anexo. La primera parte se dedica a explicar, a nivel introductorio, los conceptos de Wikimedia, Wikipedia y Wikidata (en particular, los dos primeros se confunden a menudo). La parte dedicada a Wikidata es la más extensa y, realmente, resulta ser una concisa y necesaria explicación de Wikidata. Tras explicar lo que es un ítem y sus componentes, entra en materia sobre las características que deben tener los datos. Éstos deben ser (y se incluye textualmente porque es la explicación más clara y concisa):

  • Libres, y más específicamente licenciados con CC0, para facilitar su uso, reutilización, y la manipulación sin problemas legales.
  • Notables, en cuanto relacionables con entidades destacables o calificables para ser destacadas en los proyectos Wikimedia.
  • Referenciados, permitiendo la verificación de los datos y la publicación de múltiples valores de acuerdo a diferentes fuentes.
  • Interrogables, permitiendo a herramientas llevar a cabo los procesos de publicación y de mantenimiento tan automáticamente como sea posible.
  • Editables, como el resto del contenido de Wikimedia, lo que implica que debes estar abierto para integrar mejoras en tus datos.
  • Mantenidos, en oposición a descargados una vez y olvidados (Wikidata está aquí para una relación a largo plazo).

Cada una de estas cuestiones es explicada con mayor detalle en el propio documento. Una vez acabada esta sección, la segunda parte del documento desgrana los beneficios y los costes que estos proyectos tienen para las instituciones participantes. En particular, se debe llamar la atención sobre el apartado dedicado a la Loss of data exclusivity («Pérdida de la exclusividad de los datos»), donde, y se cita textualmente, «Los museos se distancian expresamente de cualquier forma de exclusividad sobre los datos que publican en la plataforma Wikidata. Una vez que los datos han sido publicados bajo CC0, esta licencia es irrevocable. A través de Wikidata, los museos donan los datos a la sociedad. Al hacerlo, los museos descartan cualquier posible modelo de ganancia / beneficio en función de la puesta a disposición a terceros para su reutilización. En concreto, esto significa, por ejemplo, que un museo no puede obtener ingresos mediante la venta de licencias sobre la colección de datos.»

Es importante llamar la atención sobre la licencia elegida: CC0 1. Universal Public Domain Dedication. Se trata de una licencia apropiada para los productos culturales libres, en todos los sentidos, y como tal es señalada por Creative Commons: «La persona que ha asociado una obra con este documento ha dedicado la obra al dominio público». Y es que, a veces, se olvida que no todas las licencias CC son libres ni suponen dominio público…

La tercera parte propone un ejemplo de estructura de datos para obras culturales, indicando metadatos obligatorios, opcionales, el elemento correspondiente dentro del esquema general de Wikidata, y unas indicaciones para cada elemento. Incluye, además, una orientación sobre los formatos de fichero que deben usarse para la importación y carga de datos. La conclusión, última parte del documento, es un breve (demasiado breve) resumen de posición. Un último valor añadido es que el documento incorpora como anexo informativo las referencias a las guías de uso de datos abiertos que aplican tres instituciones de gran prestigio, como The Museum of Modern Art (MoMA), The Tate Gallery, y The Smithsonian Cooper-Hewitt, National Design Museum. En su conjunto, un documento que sirve como punto de partida para plantear proyectos de Cultural Linked Open Data, y para detenerse a pensar si realmente merece la pena afrontar el descrédito y el rechazo que supone la mercantilización del patrimonio cultural.

Jesús Tramullas
Vocal de Bibliotecas, Archivos y Museos (GLAM)
(Publicado originalmente en el Blok de Bid, CC BY 3.0)