Nace la Wikipedia semántica en español

La versión española de DBpedia arranca con 70 millones de datos que representan al 80% de la información en castellano contenida en Wikipedia


Después de intensos meses de trabajo y de colaboración desinteresada de universitarios y expertos, ha nacido por fin la versión española de DBpedia, también llamada Wikipedia semántica en español. Esta versión cuenta con casi 70 millones de datos que representan el 80% de la información en español de Wikipedia, alcanzando el nivel de la DBpedia en otros idiomas, como el inglés o el francés.


Redacción
08/05/2012

Fuente: wiki.dbpedia.org.
Después de intensos meses de trabajo y de colaboración desinteresada de universitarios y expertos, ha nacido por fin la versión española de DBpedia, también llamada Wikipedia semántica en español, informa un comunicado de la Facultad de Informática de la Universidad Politécnica de Madrid (UPM).

La DBpedia en español nace con casi 70 millones de datos, que representan el 80% de la información en español de Wikipedia, alcanzando el nivel de la DBpedia en otros idiomas, como el inglés o el francés.

Gracias a este esfuerzo colectivo ya es posible, por ejemplo, preguntar en la página de DBpedia en español cuántos toreros españoles están (o estuvieron) casados con cantantes de copla y obtener la siguiente respuesta: Ortega Cano con Rocío Jurado, Curro Romero con Concha Márquez Piquer, y Francisco Ribera con Isabel Pantoja.

Versión semántica de Wikipedia

DBpedia es un proyecto para la extracción de datos de Wikipedia y la construcción de una versión semántica de esta enciclopedia de Internet. Es un esfuerzo de la comunidad por extraer información estructurada de la Wikipedia y hacerla accesible a través de la Web.

Esta información se genera mediante la ejecución de documentos de transformación, que permiten especificar cómo los datos se transforman al lenguaje de la Web Semántica (RDF), de acuerdo con vocabularios comúnmente utilizados por un gran número de organizaciones.

El lenguaje RDF es un estándar del consorcio de la World Wide Web para la representación de datos en la Web, y es la base de la Web de Datos (para más información, Oscar Corcho participó recientemente en un coloquio en Radio Nacional de España donde se explica esta iniciativa)

Datos en español para desarrolladores

El proyecto DBpedia ha generado durante mucho tiempo información semántica a partir de la wikipedia inglesa. Desde junio de 2011, el proceso de generación de información extrae información de Wikipedia en 15 de sus versiones (idiomas).

Uno de ellos es el español, al que el comité de internacionalización de DBpedia ha asignado un sitio web y un punto de consultas (SPARQL Endpoint), al igual que a los demás idiomas.

La DBpedia en español está desarrollada y sostenida por investigadores de la Universidad Autónoma de Madrid (Mariano Rico) y de la Facultad de Informática de la Universidad Politécnica de Madrid (Óscar Corcho), todos ellos pertenecientes a la Red Temática Española de Linked Data, así como de particulares que dedican su tiempo y su esfuerzo a esta iniciativa.

Es una web pensada para desarrolladores, que mantienen y gestionan los datos semánticos, si bien tiene aplicaciones directamente relacionadas con colectivos profesionales específicos, como los periodistas de datos y el sector infomediario, entre otros.

Para periodistas e infomediarios

Los periodistas de datos («data journalists») buscan documentos relevantes pero poco accesibles, los contrastan y construyen historias en torno a ellos, presentándolos mediante infografías o visualizaciones.

El Sector Infomediario está formado por el conjunto de empresas que generan aplicaciones, productos y servicios de valor añadido destinados a terceros, a partir de la información del Sector Público.

DBpedia, al extraer datos de Wikipedia, detecta también posibles errores de origen que pueden ser comunicados a los editores para que los corrijan, lo que añade valor a su enorme potencial social.



Redacción
Artículo leído 19055 veces



Más contenidos