En informática , los datos enlazados son datos estructurados que están interconectados con otros datos para que resulten más útiles a través de consultas semánticas . Se basan en tecnologías web estándar como HTTP , RDF y URI , pero en lugar de utilizarlas para ofrecer páginas web solo a lectores humanos, las amplía para compartir información de una manera que pueda ser leída automáticamente por las computadoras. Parte de la visión de los datos enlazados es que Internet se convierta en una base de datos global . [1]
Los datos vinculados también pueden ser datos abiertos , en cuyo caso se los suele describir como Datos Abiertos Vinculados. [3]
Principios
En su nota de 2006 sobre "Datos vinculados", Tim Berners-Lee describió cuatro principios de los datos vinculados, parafraseados de la siguiente manera: [2]
Se deben utilizar URI HTTP para permitir que estas cosas se busquen, se interpreten y, posteriormente, se "desreferencian".
Se debe proporcionar información útil sobre lo que identifica un nombre a través de estándares abiertos como RDF , SPARQL , etc.
Al publicar datos en la Web, se debe hacer referencia a otras cosas utilizando sus nombres basados en URI HTTP.
Tim Berners-Lee reiteró posteriormente estos principios en una conferencia TED de 2009 , parafraseándolos nuevamente de la siguiente manera: [4]
Todas las cosas conceptuales deben tener un nombre que comience con HTTP .
Buscar un nombre HTTP debería devolver datos útiles sobre la cosa en cuestión en un formato estándar.
Cualquier otra cosa con la que esa misma cosa tenga una relación a través de sus datos también debe recibir un nombre que comience con HTTP.
Componentes
De este modo, podemos identificar los siguientes componentes como esenciales para un sistema global de Datos Vinculados tal como se ha previsto, y para cualquier subconjunto real de Datos Vinculados dentro de él:
Los datos abiertos vinculados son datos vinculados que son datos abiertos . [5] [6] [7] Tim Berners-Lee ofrece la definición más clara de datos abiertos vinculados para diferenciarlos de los datos vinculados.
Linked Open Data (LOD) son datos vinculados que se publican bajo una licencia abierta, lo que no impide su reutilización de forma gratuita.
— Tim Berners-Lee, Datos vinculados [2] [8]
Los grandes conjuntos de datos abiertos vinculados incluyen DBpedia , Wikibase , Wikidata y Open ICEcat [uk; nl] .
Datos abiertos vinculados de 5 estrellas
En 2010, Tim Berners-Lee sugirió un sistema de 5 estrellas para calificar la calidad de los datos abiertos en la web, en el que la clasificación más alta corresponde a Linked Open Data: [10]
1 estrella: los datos están disponibles abiertamente en algún formato.
3 estrellas: los datos están disponibles en un formato estructurado no propietario, como valores separados por comas (.csv).
4 estrellas: los datos siguen los estándares del W3C , como el uso de RDF y el empleo de URI .
5 estrellas: todos los demás, más enlaces a otras fuentes de Linked Open Data.
Historia
El término "datos abiertos vinculados" se ha utilizado al menos desde febrero de 2007, cuando se creó la lista de correo "Linking Open Data" [11] [12] . La lista de correo fue inicialmente alojada por el proyecto SIMILE [13] en el Instituto Tecnológico de Massachusetts .
Proyecto comunitario Linking Open Data
El objetivo del proyecto comunitario Linking Open Data del grupo de Educación y Difusión de la Web Semántica del W3C es ampliar la Web con un patrimonio común de datos mediante la publicación de varios conjuntos de datos abiertos como RDF en la Web y mediante el establecimiento de enlaces RDF entre elementos de datos de diferentes fuentes de datos. En octubre de 2007, los conjuntos de datos constaban de más de dos mil millones de triples RDF , que estaban interconectados por más de dos millones de enlaces RDF. [15] [16] Para septiembre de 2011, esta cifra había aumentado a 31 mil millones de triples RDF, interconectados por alrededor de 504 millones de enlaces RDF. En 2014 se publicó un desglose estadístico detallado. [17]
Proyectos de la Unión Europea
Existen varios proyectos de la Unión Europea relacionados con los datos vinculados, entre ellos el proyecto LATC (Linked Open Data Around the Clock), [18] el proyecto AKN4EU para datos legislativos legibles por máquina, [19] el proyecto PlanetData, [20] el proyecto DaPaaS (Data-and-Platform-as-a-Service), [21] y el proyecto LOD2 (Linked Open Data 2). [22] [23] [24] La vinculación de datos es uno de los principales objetivos del Portal de Datos Abiertos de la UE , que pone a disposición miles de conjuntos de datos para que cualquiera pueda reutilizarlos y vincularlos.
Ontologías
Las ontologías son descripciones formales de estructuras de datos. Algunas de las ontologías más conocidas son:
FOAF – una ontología que describe a las personas, sus propiedades y relaciones
UMBEL : una estructura de referencia liviana de 20 000 clases de conceptos temáticos y sus relaciones derivadas de OpenCyc , que pueden actuar como clases de enlace a datos externos; también tiene enlaces a 1,5 millones de entidades nombradas de DBpedia y YAGO
Conjuntos de datos
DBpedia : un conjunto de datos que contiene datos extraídos de Wikipedia; contiene alrededor de 3,4 millones de conceptos descritos por mil millones de triples , incluidos resúmenes en 11 idiomas diferentes
GeoNames : proporciona descripciones RDF de más de 7.500.000 características geográficas en todo el mundo
Wikidata : un conjunto de datos vinculados creado de forma colaborativa que actúa como almacenamiento central para los datos estructurados de sus proyectos hermanos de la Fundación Wikimedia.
Base de datos de identificadores de investigación global ( GRID ): una base de datos internacional de 89 506 instituciones dedicadas a la investigación académica, con 14 401 relaciones. GRID modela dos tipos de relaciones: una relación padre-hijo que define una asociación subordinada y una relación relacionada que describe otras asociaciones [25] [26]
KnowWhereGraph [27] – un gráfico de conocimiento integrado de 12 mil millones de triples de 30 capas de datos en la intersección entre los humanos y su entorno utilizando tecnologías de Web semántica y datos vinculados. [28]
Relaciones entre clases e instancias de conjuntos de datos
Están disponibles diagramas en los que se puede hacer clic que muestran los conjuntos de datos individuales y sus relaciones dentro de la nube LOD generada por DBpedia (como en las figuras de la derecha). [29] [30]
Véase también
American Art Collaborative : consorcio de museos de arte de Estados Unidos comprometidos a establecer una masa crítica de datos abiertos vinculados sobre el arte estadounidense
Control de autoridad : acerca de los encabezados controlados en los catálogos de bibliotecas
^ "Datos vinculados como JSON". Datos vinculados como JSON . Consultado el 4 de diciembre de 2020 .
^ abc Tim Berners-Lee (27 de julio de 2006). "Linked Data". Problemas de diseño . W3C . Consultado el 18 de diciembre de 2010 .
^ "¿Qué son los Linked Data y los Linked Open Data?". Ontotext . Consultado el 8 de mayo de 2019 .
^ "Tim Berners-Lee en la próxima Web". Archivado desde el original el 10 de abril de 2011. Consultado el 15 de marzo de 2009 .
^ "Preguntas frecuentes (FAQ) - Datos vinculados - Conectar datos distribuidos en la Web". Archivado desde el original el 18 de noviembre de 2015. Consultado el 29 de diciembre de 2014 .
^ "COAR » 7 cosas que debes saber sobre… Linked Data". Archivado desde el original el 2015-11-18 . Consultado el 2015-12-29 .
^ "Conceptos básicos de Linked Data para técnicos". Archivado desde el original el 5 de mayo de 2021. Consultado el 29 de diciembre de 2015 .
^ "Datos abiertos 5 estrellas".
^ "Datos abiertos de 5 estrellas". 5stardata.info . Consultado el 7 de marzo de 2021 .
^ "¿Qué son los datos vinculados de 5 estrellas? | Grupo comunitario Webize Everything". www.w3.org . Consultado el 7 de marzo de 2021 .
^ "SweoIG/TaskForces/Proyectos comunitarios/LinkingOpenData/Archivo de noticias".
^ "Proyecto SIMILE - Listas de correo".
^ Diagrama de nube de datos abiertos de 2014, por Max Schmachtenberg, Christian Bizer, Anja Jentzsch y Richard Cyganiak. http://lod-cloud.net/
^ "SweoIG/TaskForces/CommunityProjects/LinkingOpenData - Wiki del W3C". esw.w3.org . Consultado el 22 de marzo de 2018 .
^ Fensel, Dieter; Facca, Federico Michele; Simperl, Elena; Ioan, Toma (2011). Servicios de Web Semántica . Saltador. pag. 99.ISBN978-3642191923.
^ Max. "Estado de la nube LOD". linkeddatacatalog.dws.informatik.uni-mannheim.de . Consultado el 22 de marzo de 2018 .
^ "Datos abiertos vinculados las 24 horas del día (LATC)". latc-project.eu . Archivado desde el original el 19 de septiembre de 2018 . Consultado el 22 de marzo de 2018 .
^ Flatt, Amelie; Langner, Arne; Leps, Olof (2022), "Desarrollo basado en modelos de perfiles de aplicaciones AKN: antecedentes y requisitos", Desarrollo basado en modelos de perfiles de aplicaciones Akoma Ntoso , Cham: Springer International Publishing, págs. 5-12, doi :10.1007/978-3-031-14132-4_2, ISBN978-3-031-14131-7, consultado el 7 de enero de 2023
^ "¡Bienvenido a PlanetData! - PlanetData". planet-data.eu . Archivado desde el original el 21 de abril de 2021 . Consultado el 22 de marzo de 2018 .
^ "DaPaaS". project.dapaas.eu . Archivado desde el original el 18 de diciembre de 2020 . Consultado el 22 de marzo de 2018 .
^ Vinculación de datos abiertos 2 (LOD2)
^ "Proyectos TIC del Séptimo Programa Marco de CORDIS – LOD2". Comisión Europea. 20 de abril de 2010.
^ "Hoja informativa del proyecto LOD2: resumen del proyecto" (PDF) . 2010-09-01. Archivado desde el original (PDF) el 2011-07-20 . Consultado el 2010-12-18 .
^ "Estadísticas de GRID". grid.ac/stats . Consultado el 26 de octubre de 2018 .
^ "Políticas de GRID". grid.ac . Consultado el 26 de octubre de 2018 .
^ "KnowWhereGraph". knowwheregraph.org . Consultado el 16 de mayo de 2022 .
^ Krzysztof Janowicz; Pascal Hitzler ; Wenwen Li; Dean Rehberger; Mark Schildhauer; Rui Zhu; Cogan Shimizu; Colby K. Fisher; Ling Cai; Gengchen Mai; Joseph Zalewski; Lu Zhou; Shirly Stephen; Seila Gonzalez Estrecha; Bryce D. Mecum; Anna Lopez-Carr; Andrew Schroeder; Dave Smith; Dawn J. Wright; Sizhe Wang; Yuanyuan Tian; Zilong Liu; Meilin Shi; Anthony D'Onofrio; Zhining G; Kitty Currier (2022). "Saber, saber dónde, saber dónde: un gráfico de conocimiento densamente conectado y multidominio y una pila de servicios de enriquecimiento geográfico para aplicaciones en inteligencia ambiental". Revista de inteligencia artificial . 43 (1): 30–39. doi : 10.1609/aimag.v43i1.19120 . hdl : 1983/be176aba-9dec-456c-9615-01a0e8556b7b .
^ "Relaciones de instancia entre conjuntos de datos". fu-berlin.de . Archivado desde el original el 17 de octubre de 2012 . Consultado el 22 de marzo de 2018 .
^ "Relaciones de clase entre conjuntos de datos". Archivado desde el original el 28 de agosto de 2011 . Consultado el 22 de marzo de 2018 .
Lectura adicional
Ahmet Soylu, Felix Mödritscher y Patrick De Causmaecker. 2012. "Navegación web ubicua mediante la recolección de datos semánticos integrados: un escenario móvil". Archivado el 19 de septiembre de 2018 en Wayback Machine. Ingeniería asistida por computadora integrada 19 (1): 93–109.
Datos vinculados: la evolución de la Web hacia un espacio de datos global (2011) de Tom Heath y Christian Bizer, Conferencias de síntesis sobre la Web semántica: teoría y tecnología, Morgan & Claypool
Cómo publicar datos vinculados en la Web Archivado el 19 de abril de 2021 en Wayback Machine , por Chris Bizer, Richard Cyganiak y Tom Heath, Tutorial de datos vinculados en la Freie Universität Berlin, Alemania, 27 de julio de 2007.
La Web cumple 20 años: los datos vinculados dan poder a las personas, parte 1 de 4, por Mark Fischetti, Scientific American 23 de octubre de 2010
Los datos vinculados son simplemente más datos – Prateek Jain, Pascal Hitzler , Peter Z. Yeh, Kunal Verma y Amit P. Sheth. En: Dan Brickley, Vinay K. Chaudhri, Harry Halpin y Deborah McGuinness: Linked Data Meets Artificial Intelligence . Informe técnico SS-10-07, AAAI Press, Menlo Park, California, 2010, págs. 82–86.
Más allá de lo mismo que con PLATO: detección de partonomías para datos vinculados – Prateek Jain, Pascal Hitzler , Kunal Verma, Peter Z. Yeh, Amit Sheth. En: Actas de la 23.ª conferencia sobre hipertexto y medios sociales de la ACM (HT 2012), Milwaukee, WI, EE. UU., 25 al 28 de junio de 2012.
Freitas, André, Edward Curry, João Gabriel Oliveira y Sean O'Riain. 2012. "Consulta de conjuntos de datos heterogéneos en la web de datos vinculados: desafíos, enfoques y tendencias". Computación de Internet IEEE 16 (1): 24–33.
Interconexión de datos abiertos en la Web: Chris Bizer, Tom Heath, Danny Ayers, Yves Raimond. En la sección de pósteres de las actas, ESWC2007, Innsbruck, Austria
Alineación de ontologías para datos abiertos vinculados – Prateek Jain, Pascal Hitzler , Amit Sheth, Kunal Verma, Peter Z. Yeh. En actas de la 9.ª Conferencia Internacional de Web Semántica, ISWC 2010, Shanghái, China
Datos abiertos y vinculados sobre medicamentos para la investigación y el desarrollo farmacéuticos - J Cheminform. 2011; 3: 19. Samwald, Jentzsch, Bouton, Kallesøe, Willighagen, Hajagos, Marshall, Prud'hommeaux, Hassenzadeh, Pichler y Stephens (mayo de 2011)
Entrevista a Sören Auer, responsable del proyecto LOD2, sobre la continuación del proyecto LOD2 en 2011, junio de 2011
Datos abiertos vinculados: aspectos esenciales - Florian Bauer y Martin Kaltenböck (enero de 2012)
El aleteo de una mariposa - semanticweb.com Richard Wallis (febrero de 2012)
Enlaces externos
Scholia tiene un perfil de tema para Datos vinculados .