Wikidata cumple 4 años

Wikidata es una base de conocimiento, estructurada, multi-lingue, y libre. Es un proyecto hermano de Wikipedia, desarrollado por Wikimedia Deutschland y alojado por la Wikimedia Foundation. El objetivo es de centralizar los conocimientos con fuentes, y utiles para los proyectos Wikimedia. El proyecto cumplió su cuarto año el 29 de octubre de 2016.

Logo Wikidata cumpleaños

Referencias: Sitio de Wikidata, Lista de eventos organizados para el cumpleaños

Una base con estándares abiertos

Wikidata usa el software libre MediaWiki, con la extensión Wikibase para manejar sus datos. Sin embargo, para aprovechar plenamente los datos relacionados, los datos están replicados en un triplestore Blazegraph. Un triplestore es una base de datos concebida especialmente para almacenar y recuperar datos RDF. Veamos algunas de sus características.

RDF

Los datos están almacenados en el formato RDF, desarrollador por el W3C. Cada información esta formada por una tupla elemento-propiedad-valor. Por ejemplo, el elemento núcleo Linux tiene la propiedad creador cuyo valor es Linus Torvalds. Como Wikidata es una base en varios idiomas, cada elemento, y cada propiedad, posee un identificador único (Q14579 para el núcleo Linux) y una etiqueta en cada idioma (núcleo Linux en español,  en inglés, etc.). El valor de una dupla puede ser un dato simple (una fecha, un número, etc.) o un otro elemento (en el ejemplo anterior, Linus Torvalds es el elemento Q34253), lo que permite relacionar los elementos entre sí.

SPARQL

El lenguaje de consultas SPARQL también desarrollado por el W3C, permite interrogar las bases RDF, y entonces Wikidata. Wikidata cuenta con una interfaz de consulta, con “auto-compleción” y numerosos ejemplo. La siguiente consulta lista los software libre más recientes:

Pueden probar esta consulta en la interfaz.

El lenguaje SPARQL se parece al lenguaje SQL de las bases de datos relacionales. La clausula SELECT permite seleccionar los campos a devolver, en el ejemplo el identificador de un elemento, su etiqueta y una fecha. La clausula WHERE permite filtrar los elementos devueltos. Aquí solo se devuelven los elementos cuya propiedad instancia de (P31) es un software libre (Q341) y cuya fecha de fundación o creación (P571) tiene un valor. El servicio wikibase:label permite recuperar automáticamente las etiquetas de los elementos, primero en español, luego en inglés si no existen en español. La clausula ORDER BY permite ordenar los resultados, aquí por fecha de creación. Finalmente la clausula LIMIT permite limitar el número de resultados, aquí a 10.

Datos en el dominio público

Los datos de Wikidata están bajo licencia Creativa Commons CC0, de manera que cualquier persona pueda reutilizarlos sin restricción. Por ejemplo, el proyecto libre inventaire.io, basado entre otros sobre Wikidata, permite listar los libros de tu biblioteca y guardar un registro de tus prestamos.

Un proyecto en desarrollo

Wikidata es un proyecto joven y todavía en proceso de desarrollo. Dos trabajos en curso son la integración del Wikcionario (un diccionario colaborativo) y de Wikimedia Commons (un banco de archivos libres) en Wikidata, para aprovechar los datos estructurados. El interés es, por ejemplo, de tener metadatos fiables y estructurados de forma común para todos los archivos de Commons, lo que no ocurre actualmente.

Se organizan encuentros alrededor del mundo hasta el 5 de noviembre para festejar el cuarto aniversario del proyecto.

Referencias

Traducción de Wikidata fête ses 4 ans.

Autores: Envel Le Hir, Davy Defaud, M5oul y ZeroHeure.

Licencia: CC by-sa.

Traducción: Sylvain Lesage.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *