Linked Data, datos enlazados o el germen de la Web 3.0

Linked data

Vamos a introducir las bases de la transición tecnológica que se acerca inminentemente, el paso de la Web 2.0 a la 3.0, cuya base es el Linked Data.

No hace mucho que compartía con vosotros una reflexión sobre cómo evolucionaría la tecnología, en la que concluíamos que el futuro de la misma se basaba fundamentalmente en obtener conocimiento de los innumerables datos que actualmente se generan en Internet. También comentábamos las técnicas de las que disponemos actualmente para sintetizar dichos datos y convertirlos en conocimiento útil.

Pero surge un problema grave, y es que la arquitectura de la web actual almacena los datos de forma desestructurada, mediante documentos de hipertexto que, si bien contienen gran cantidad de datos, la única manera de enlazarlos a priori es la capacidad cognitiva del lector. La consecuencia directa de este hecho es que resulta muy difícil para un interlocutor no-humano relacionar los datos contenidos y lograr extraer conocimiento de los mismos, y puesto que esta característica cada vez está más cerca de ser una necesidad, se ha acuñado el concepto de Linked Data.

Linked data
Fuente: Flickr

Historia y evolución de la Web

Como la mayoría sabréis, el científico de la computación británico Tim Berners-Lee acuñó el término de World Wide Web (o Web 1.0) mientras trabajaba en el CERN, debido a la creciente necesidad de compartir datos a nivel mundial, pero fue en 1992 cuando este ambicioso proyecto vió la luz y se hizo realidad. Berners-Lee propuso el intercambio de información basada en el Hipertexto (HTTP y HTML) y consiguió una revolución a nivel mundial.

Linked data
Fuente: Flickr

El impacto a nivel mundial que tuvo la Web hizo que su crecimiento fuera exponencial. En pocos años pasó de ser un medio para el intercambio de información a nivel de organizaciones a poder ser utilizado por miles de usuarios desde su propio hogar. Esto ocasionó que los usuarios domésticos empezaran a generar contenido propio, convirtiendo la Web en un ecosistema bidireccional.

Tal fué el impacto de la participación popular en el contenido de la Web que las bases de la misma fueron redefinidas, dando lugar a la Web 2.0 en 2004. Esta evolución tuvo como consecuencia, aparte de la generación activa de contenido por parte de los usuarios, la transición de una arquitectura estática a un sistema dinámico de contenidos.

Pasaron poco más de 10 años desde que las necesidades que ocasionaron la creación de la Web fueran radicalmente modificadas, y en la actualidad ha pasado ese mismo tiempo desde la aparición de la Web 2.0. ¿Qué quiere decir esto? Pues quiere decir que, hablando en términos de tecnología, ha pasado una era completa y el sistema actual está quedando obsoleto.

¿Qué es Linked Data?

Para entender lo que significa Linked Data primero debemos conocer las necesidades actuales de la Web. Como comentábamos al principio, actualmente la arquitectura de la Web se basa en documentos enlazados entre sí cuyo contenido está relativamente relacionado, pero la información que contienen los mismos está desestructurada.

De esta manera si queremos buscar información sobre, por ejemplo, una escapada de fin de semana a una determinada ubicación obtenemos datos textuales que nos describen la misma. Sin embargo hay mucha información de interés que no se nos procura, como los medios de transporte para llegar a la misma, el estado del clima en los días concretos, la densidad de gente que va a haber, etc.

Sin embargo aplicando nuestra capacidad cognitiva podemos obtener información acerca de todos estos factores haciendo múltiples búsquedas sobre cada uno de ellos. Pero en una sociedad tan avanzada como la nuestra, ¿por qué no obtenemos toda esta información de manera automática? La respuesta es simple, porque la estructura de la Web actual hace que obtener dicha información mediante mecanismos computacionales sea un auténtico reto tecnológico, ya que toda esta información relacionada no está accesible de manera inmediata para un programa computacional.

Linked Data es la propuesta que Tim Berners-Lee presenta ante esta necesidad. Mediante Linked Data, o datos enlazados, se pretende que el contenido que se publique en la Web se base en datos que anteriormente se encuentren enlazados mediante relaciones significativas.

Para ello se proponen una serie de medidas publicadas en w3c.es y que explicaremos brevemente a continuación. Los pilares básicos del Linked Data son los siguientes:

  1. Usar URIs para identificar las «cosas»: Si cada concepto tiene un identificador único, lograremos identificarlos de manera no ambigua y consiguiendo así una abstracción del lenguaje natural.
  2. Usar URIs HTTP: Puesto que las URIs HTTP disponen de esquemas bien definidos, el objetivo nombrar a los recursos mediante este sistema, por ejemplo: http://dbpedia.com/resources/Europa.
  3. Ofrecer información sobre los recursos utilizando RDFs: Mediante especificaciones RDF se pretende dotar de una serie de metadatos a cada recurso, de tal manera que se asocie fácilmente un contexto, un vocabulario o información relacionada con el recurso en cuestión.
  4. Incluir enlaces a otros URIsEste punto es en el que realmente generamos Linked Data, se pretende que todos los conceptos relacionados con un término sean enlazados con vínculos a sus URIs. Por ejemplo, el término España se vinculará mediante Linked Data a Madrid (su capital), entre otros.
Linked Data
Fuente: w3.org

Todo esto son conceptos que se llevan fraguando desde hace años. De hecho el proyecto DBPedia trata de relacionar semánticamente la información contenida en la Wikipedia mediante Linked Data. Os recomiendo que le echéis un ojo porque se pueden hacer cosas bastante interesantes.

Para concluir, os dejo una conferencia difundida por TED en la que Tim Berners-Lee explica todos estos conceptos. La conferencia está en inglés pero dispone de subtítulos en español revisados.

¿Qué os parece el Linked Data y la evolución de la Web?¿Creeis que es un paso necesario?

Últimos artículos

Scroll al inicio