Nuevo paso hacia la Web Semántica

Según un comunicado publicado por el MIT (Massachusetts Institute of Technology), el organismo de normalización industrial W3C (Word Wide Web Consortium) ha desarrollado un nuevo estándar que permitirá adelantar posiciones en la carrera por lanzar la verdadera Web Semántica. Sus creadores lo han bautizado como RIF, Regla de Intercambio de Formato, un camino diferente que establece las normas que deben seguir los programadores a la hora de escribir las reglas de intercambio de datos provenientes de diferentes sitios web.

El concepto de Web Semántica hace referencia a una Web extendida, es decir, dotada de mayor significado (más semántica), en la que cualquier usuario podrá encontrar respuestas a sus preguntas de forma más rápida y sencilla gracias a una información mejor definida. Gracias a la semántica en la Web, el software es capaz de superar los problemas de sobrecarga de información y heterogeneidad de fuentes, procesando los contenidos de las páginas de Internet, combinándolos y realizando deducciones lógicas.

Para entender cómo funciona supongamos que estamos buscando los menús de un determinado tipo de restaurante en una parte concreta de la ciudad. Mientras una búsqueda convencional nos devolvería un listado de páginas que contienen la palabra “menú”, la misma operación con la Web Semántica sólo nos ofrecería los sitios exactos dónde consultar detalladamente los menús de los restaurantes que nos interesan.

Pero… ¿cómo lo hace? No se trata de una inteligencia artificial mágica que permita a las máquinas entender las palabras de los usuarios, sino de la habilidad de un software para resolver problemas bien concretos, a través de operaciones bien planteadas que se llevarán a cabo sobre datos existentes bien definidos. Para lograr esta capacidad de concreción la Web Semántica utiliza mecanismos que ayudan a convertir la Web en una infraestructura global en la que es posible compartir y reutilizar datos y documentos entre diferentes tipos de usuarios.

En palabras de Sandro Hawke, arquitecto de sistemas en la World Wide Web Consortium (W3C), “la Web Semántica es una base de datos donde cada persona controla su propia información. Usted dispone de su parte de la base de datos, de modo que puede poner en ella cualquier dato que desee".

La Regla de Formato de Intercambio

Visto así, nos encontramos ante una gigantesca base de datos en red donde la gente tiene la capacidad de controlar sus propios datos y asegurarse de que sus contribuciones no se clasifican o registran incorrectamente. Sin embargo, no hay nada que garantice que todo el mundo vaya a organizar y etiquetar sus datos de manera uniforme. Por ejemplo, si dos clínicas médicas norteamericanas deciden publicar en Internet la lista de sus trabajadores etiquetándolos por sus apellidos, puede suceder que usen dos palabras diferentes para categorizarlos: “surname” y “last name”. Si un usuario busca en Internet los médicos de su ciudad y escribe uno de esos dos sustantivos, es muy probable que no encuentre a los profesionales etiquetados con la otra palabra utilizada para referirse al apellido.

Para resolver este problema ya existe un estándar (Web Ontology Language), que en el anterior ejemplo proporcionaría a los programadores una manera de identificar que “surname”, “last name”, y quizá, “family name” hacen referencia al mismo tipo de datos. Pero, ¿qué ocurriría si una tercera clínica decidiera unir el nombre, el apellido y la inicial del segundo apellido en una sola categoría denominada “nombre”? De nuevo, esta regla no funcionaría. Sería necesaria una norma que unificase los datos.

Ahora, los investigadores del MIT, que trabajan para el W3C, creen haberla encontrado. Se llama Regla de Formato de Intercambio o RIF, y se trata de un estándar que ofrece a los programadores web una nueva forma de escribir normas para intercambiar datos de diferentes sitios de Internet de manera exitosa. “La nueva regla permite poner en la misma mesa diferentes posibilidades de empleo y conseguir un único estándar que pueda ser utilizado en cado una de esos pequeños casos”, afirma Hawke.

A pesar del entusiasmo de sus creadores, si la norma RIF se populariza es probable que los cambios en la Web pasen desapercibidos para la mayoría de los usuarios de Internet. Y es que la Red ya está repleta de páginas construidas con datos agregados de otros sitios, como la página principal de Google, que permite personalizarla con los titulares de varias fuentes de información diferentes, la información meteorológica de otro sitio y los valores de las acciones de otro más, por ejemplo. Pero como explica Hawke, la diferencia entre la Web que conocemos y la Web Semántica es que en la primera “puedes construir una página en la que agregar datos conocidos, y en la web del futuro se da la opción de recuperar datos que ni siquiera sabes que existen”. Una página pequeña en la que se enumeran los eventos del fin de semana en un barrio en particular, por ejemplo, podría recuperar datos de fuentes que no existían cuando se construyó, siempre y cuando sus datos estén categorizados de acuerdo a los estándares de la Web Semántica.

Aunque han pasado casi 20 años desde que Berners-Lee lanzó la primera página web, si su idea original finalmente se concreta, "va a suceder tan rápido que nadie lo sabrá", predice Hawke. "La gente sólo se dará cuenta de que Internet podrá hacer cosas más interesantes."

Nuevo paso hacia la Web Semántica

Un estándar ofrece a los programadores otra forma de escribir reglas para intercambiar datos sobre sitios diferentes

{{date}} {{title}}