Wikidata es una base de conocimiento, estructurada, multi-lingue, y libre. Es un proyecto hermano de Wikipedia, desarrollado por Wikimedia Deutschland y alojado por la Wikimedia Foundation. El objetivo es de centralizar los conocimientos con fuentes, y utiles para los proyectos Wikimedia. El proyecto cumplió su cuarto año el 29 de octubre de 2016.
Referencias: Sitio de Wikidata, Lista de eventos organizados para el cumpleaños
Una base con estándares abiertos
Wikidata usa el software libre MediaWiki, con la extensión Wikibase para manejar sus datos. Sin embargo, para aprovechar plenamente los datos relacionados, los datos están replicados en un triplestore Blazegraph. Un triplestore es una base de datos concebida especialmente para almacenar y recuperar datos RDF. Veamos algunas de sus características.
RDF
Los datos están almacenados en el formato RDF, desarrollador por el W3C. Cada información esta formada por una tupla elemento-propiedad-valor. Por ejemplo, el elemento núcleo Linux tiene la propiedad creador cuyo valor es Linus Torvalds. Como Wikidata es una base en varios idiomas, cada elemento, y cada propiedad, posee un identificador único (Q14579 para el núcleo Linux) y una etiqueta en cada idioma (núcleo Linux en español, en inglés, etc.). El valor de una dupla puede ser un dato simple (una fecha, un número, etc.) o un otro elemento (en el ejemplo anterior, Linus Torvalds es el elemento Q34253), lo que permite relacionar los elementos entre sí.
SPARQL
El lenguaje de consultas SPARQL también desarrollado por el W3C, permite interrogar las bases RDF, y entonces Wikidata. Wikidata cuenta con una interfaz de consulta, con «auto-compleción» y numerosos ejemplo. La siguiente consulta lista los software libre más recientes:
SELECT ?item ?itemLabel ?date WHERE { ?item wdt:P31 wd:Q341 . ?item wdt:P571 ?date . SERVICE wikibase:label { bd:serviceParam wikibase:language "es,en" } } ORDER BY DESC(?date) LIMIT 10
Pueden probar esta consulta en la interfaz.
El lenguaje SPARQL se parece al lenguaje SQL de las bases de datos relacionales. La clausula SELECT
permite seleccionar los campos a devolver, en el ejemplo el identificador de un elemento, su etiqueta y una fecha. La clausula WHERE
permite filtrar los elementos devueltos. Aquí solo se devuelven los elementos cuya propiedad instancia de (P31) es un software libre (Q341) y cuya fecha de fundación o creación (P571) tiene un valor. El servicio wikibase:label
permite recuperar automáticamente las etiquetas de los elementos, primero en español, luego en inglés si no existen en español. La clausula ORDER BY
permite ordenar los resultados, aquí por fecha de creación. Finalmente la clausula LIMIT
permite limitar el número de resultados, aquí a 10.
Datos en el dominio público
Los datos de Wikidata están bajo licencia Creativa Commons CC0, de manera que cualquier persona pueda reutilizarlos sin restricción. Por ejemplo, el proyecto libre inventaire.io, basado entre otros sobre Wikidata, permite listar los libros de tu biblioteca y guardar un registro de tus prestamos.
Un proyecto en desarrollo
Wikidata es un proyecto joven y todavía en proceso de desarrollo. Dos trabajos en curso son la integración del Wikcionario (un diccionario colaborativo) y de Wikimedia Commons (un banco de archivos libres) en Wikidata, para aprovechar los datos estructurados. El interés es, por ejemplo, de tener metadatos fiables y estructurados de forma común para todos los archivos de Commons, lo que no ocurre actualmente.
Se organizan encuentros alrededor del mundo hasta el 5 de noviembre para festejar el cuarto aniversario del proyecto.
Referencias
Traducción de Wikidata fête ses 4 ans.
Autores: Envel Le Hir, Davy Defaud, M5oul y ZeroHeure.
Licencia: CC by-sa.
Traducción: Sylvain Lesage.