Web semántica

Ampliación de la Web para facilitar el intercambio de datos

Una nube de etiquetas (un fenómeno típico de la Web 3.0 en sí mismo) que presenta temas de la Web 3.0

La Web semántica , a veces conocida como Web 3.0 (que no debe confundirse con Web3 ), es una extensión de la World Wide Web a través de estándares [1] establecidos por el Consorcio World Wide Web (W3C). El objetivo de la Web semántica es hacer que los datos de Internet sean legibles por máquinas .

Para permitir la codificación de la semántica con los datos, se utilizan tecnologías como Resource Description Framework (RDF) [2] y Web Ontology Language (OWL) [3] . Estas tecnologías se utilizan para representar formalmente metadatos . Por ejemplo, la ontología puede describir conceptos , relaciones entre entidades y categorías de cosas. Estas semánticas integradas ofrecen ventajas significativas, como el razonamiento sobre datos y el funcionamiento con fuentes de datos heterogéneas. [4] Estos estándares promueven formatos de datos comunes y protocolos de intercambio en la Web, fundamentalmente el RDF. Según el W3C, "La Web Semántica proporciona un marco común que permite compartir y reutilizar datos a través de los límites de aplicaciones, empresas y comunidades". [5] Por lo tanto, la Web Semántica se considera un integrador entre diferentes aplicaciones y sistemas de contenido e información.

Historia

El término fue acuñado por Tim Berners-Lee para referirse a una red de datos (o red de datos ) [6] que puede ser procesada por máquinas [7], es decir, una en la que gran parte del significado es legible por máquinas . Si bien sus críticos han cuestionado su viabilidad, los defensores argumentan que las aplicaciones en la investigación en biblioteconomía y ciencias de la información , la industria, la biología y las ciencias humanas ya han demostrado la validez del concepto original. [8]

Berners-Lee expresó originalmente su visión de la Web Semántica en 1999 de la siguiente manera:

Sueño con una Web en la que los ordenadores sean capaces de analizar todos los datos que hay en ella: el contenido, los vínculos y las transacciones entre personas y ordenadores. Todavía no ha surgido una "Web semántica" que haga posible esto, pero cuando lo haga, los mecanismos cotidianos del comercio, la burocracia y nuestra vida diaria estarán a cargo de máquinas que se comunicarán con máquinas. Los " agentes inteligentes " que la gente ha promocionado durante siglos finalmente se materializarán. [9]

El artículo de 2001 de la revista Scientific American escrito por Berners-Lee, Hendler y Lassila describió una evolución esperada de la Web existente hacia una Web semántica. [10] En 2006, Berners-Lee y sus colegas afirmaron que: "Esta simple idea... sigue en gran medida sin hacerse realidad". [11] En 2013, más de cuatro millones de dominios web (de un total aproximado de 250 millones) contenían marcado de Web semántica. [12]

Ejemplo

En el siguiente ejemplo, se anotará el texto "Paul Schuster nació en Dresde" en un sitio web, conectando a una persona con su lugar de nacimiento. El siguiente fragmento HTML muestra cómo se describe un pequeño gráfico, en sintaxis RDFa, utilizando un vocabulario de schema.org y un identificador de Wikidata :

< div  vocab = "https://schema.org/"  typeof = "Persona" >  < span  property = "nombre" > Paul Schuster </ span > nació en < span  property = "lugardenacimiento"  typeof = "lugar"  href = "https://www.wikidata.org/entity/Q1731" >  < span  property = "nombre" > Dresde </ span > . </ span > </ div >
Gráfico resultante del ejemplo RDFa

El ejemplo define los siguientes cinco triples (mostrados en sintaxis Turtle ). Cada triple representa una arista en el gráfico resultante: el primer elemento del triple (el sujeto ) es el nombre del nodo donde comienza la arista, el segundo elemento (el predicado ) el tipo de la arista y el último y tercer elemento (el objeto ) el nombre del nodo donde termina la arista o un valor literal (por ejemplo, un texto, un número, etc.).

 _ : un  <https://www.w3.org/1999/02/22-rdf-syntax-ns#type>  <https://schema.org/Person>  .  _ : un  <https://schema.org/name>  "Paul Schuster"  .  _ : un  <https://schema.org/birthPlace>  <https://www.wikidata.org/entity/Q1731>  .  <https://www.wikidata.org/entity/Q1731>  <https://schema.org/itemtype>  <https://schema.org/Place>  .  <https://www.wikidata.org/entity/Q1731>  <https://schema.org/name>  "Dresde"  .

Los triples dan como resultado el gráfico que se muestra en la figura dada.

Gráfico resultante del ejemplo RDFa, enriquecido con más datos de la Web

Una de las ventajas de utilizar identificadores uniformes de recursos (URI) es que se pueden desreferenciar mediante el protocolo HTTP . Según los principios de Linked Open Data , un URI desreferenciado de este tipo debería dar como resultado un documento que ofrezca más datos sobre el URI en cuestión. En este ejemplo, todos los URI, tanto para los bordes como para los nodos (por ejemplo http://schema.org/Person, , http://schema.org/birthPlace, http://www.wikidata.org/entity/Q1731) se pueden desreferenciar y darán como resultado más gráficos RDF que describen el URI, por ejemplo, que Dresde es una ciudad de Alemania o que una persona, en el sentido de ese URI, puede ser ficticia.

El segundo gráfico muestra el ejemplo anterior, pero ahora enriquecido con algunos de los triples de los documentos que resultan de la desreferenciación https://schema.org/Person(borde verde) y https://www.wikidata.org/entity/Q1731(bordes azules).

Además de los bordes que se dan explícitamente en los documentos involucrados, los bordes se pueden inferir automáticamente: el triple

 _ : un  <https://www.w3.org/1999/02/22-rdf-syntax-ns#type>  <http://schema.org/Person>  .

del fragmento RDFa original y el triple

 <https://schema.org/Person>  <http://www.w3.org/2002/07/owl#equivalentClass>  <http://xmlns.com/foaf/0.1/Person>  .

Del documento en https://schema.org/Person(borde verde en la figura) se puede inferir el siguiente triple, dada la semántica OWL (línea discontinua roja en la segunda figura):

 _ : un  <https://www.w3.org/1999/02/22-rdf-syntax-ns#type>  <http://xmlns.com/foaf/0.1/Person>  .

Fondo

El concepto de modelo de red semántica fue formado a principios de la década de 1960 por investigadores como el científico cognitivo Allan M. Collins , el lingüista Ross Quillian y la psicóloga Elizabeth F. Loftus como una forma de representar el conocimiento semánticamente estructurado. Cuando se aplica en el contexto de la Internet moderna, extiende la red de páginas web hipervinculadas legibles por humanos insertando metadatos legibles por máquina sobre las páginas y cómo se relacionan entre sí. Esto permite que los agentes automatizados accedan a la Web de forma más inteligente y realicen más tareas en nombre de los usuarios. El término "Web semántica" fue acuñado por Tim Berners-Lee , [7] el inventor de la World Wide Web y director del Consorcio World Wide Web (" W3C "), que supervisa el desarrollo de los estándares propuestos para la Web semántica. Define la Web semántica como "una red de datos que pueden ser procesados ​​directa e indirectamente por máquinas".

Muchas de las tecnologías propuestas por el W3C ya existían antes de que se las posicionara bajo el paraguas del W3C. Se utilizan en diversos contextos, en particular en aquellos que tratan con información que abarca un dominio limitado y definido, y donde compartir datos es una necesidad común, como la investigación científica o el intercambio de datos entre empresas. Además, han surgido otras tecnologías con objetivos similares, como los microformatos .

Limitaciones del HTML

Muchos archivos de una computadora típica también se pueden dividir en documentos legibles para humanos y datos legibles para máquinas. Los documentos como mensajes de correo, informes y folletos son leídos por humanos. Los datos, como calendarios, libretas de direcciones, listas de reproducción y hojas de cálculo, se presentan mediante un programa de aplicación que permite verlos, buscarlos y combinarlos.

En la actualidad, la World Wide Web se basa principalmente en documentos escritos en lenguaje de marcado de hipertexto (HTML), una convención de marcado que se utiliza para codificar un cuerpo de texto intercalado con objetos multimedia, como imágenes y formularios interactivos. Las etiquetas de metadatos proporcionan un método mediante el cual las computadoras pueden categorizar el contenido de las páginas web. En los ejemplos siguientes, a los nombres de campo "palabras clave", "descripción" y "autor" se les asignan valores como "informática", "widgets baratos a la venta" y "John Doe".

< meta  name = "keywords"  content = "informática, estudios informáticos, computadora"  /> < meta  name = "description"  content = "Widgets baratos a la venta"  /> < meta  name = "author"  content = "John Doe"  />

Gracias a este etiquetado y categorización de metadatos, otros sistemas informáticos que quieran acceder y compartir estos datos pueden identificar fácilmente los valores relevantes.

Con HTML y una herramienta para reproducirlo (quizás un software de navegador web , tal vez otro agente de usuario ), se puede crear y presentar una página que incluya artículos a la venta. El HTML de esta página de catálogo puede hacer afirmaciones simples a nivel de documento como "el título de este documento es 'Widget Superstore ' ", pero no hay capacidad dentro del HTML mismo para afirmar de manera inequívoca que, por ejemplo, el número de artículo X586172 es un Acme Gizmo con un precio de venta al público de 199 €, o que es un producto de consumo. En cambio, HTML solo puede decir que el fragmento de texto "X586172" es algo que debería ubicarse cerca de "Acme Gizmo" y "199 €", etc. No hay forma de decir "esto es un catálogo" o incluso de establecer que "Acme Gizmo" es una especie de título o que "199 €" es un precio. Tampoco hay forma de expresar que estas piezas de información están unidas para describir un artículo discreto, distinto de otros artículos que tal vez se incluyan en la página.

El HTML semántico se refiere a la práctica tradicional de HTML de marcar siguiendo la intención, en lugar de especificar detalles de diseño directamente. Por ejemplo, el uso de <em>para indicar "énfasis" en lugar de <i>, que especifica cursiva . Los detalles de diseño se dejan en manos del navegador, en combinación con hojas de estilo en cascada . Pero esta práctica no llega a especificar la semántica de objetos como artículos en venta o precios.

Los microformatos amplían la sintaxis HTML para crear un marcado semántico legible por máquina sobre objetos, incluidas personas, organizaciones, eventos y productos. [13] Iniciativas similares incluyen RDFa , Microdata y Schema.org .

Soluciones de Web Semántica

La Web semántica lleva la solución más allá. Implica la publicación en lenguajes diseñados específicamente para datos: Resource Description Framework (RDF), Web Ontology Language (OWL) y Extensible Markup Language ( XML ). HTML describe documentos y los vínculos entre ellos. RDF, OWL y XML, por el contrario, pueden describir cosas arbitrarias, como personas, reuniones o partes de aviones.

Estas tecnologías se combinan para proporcionar descripciones que complementen o reemplacen el contenido de los documentos web. Así, el contenido puede manifestarse como datos descriptivos almacenados en bases de datos accesibles desde la web , [14] o como marcado dentro de los documentos (en particular, en HTML extensible ( XHTML ) intercalado con XML, o, más a menudo, puramente en XML, con señales de diseño o representación almacenadas por separado). Las descripciones legibles por máquina permiten a los administradores de contenido agregar significado al contenido, es decir, describir la estructura del conocimiento que tenemos sobre ese contenido. De esta manera, una máquina puede procesar el conocimiento por sí misma, en lugar del texto, utilizando procesos similares al razonamiento deductivo y la inferencia humanos , obteniendo así resultados más significativos y ayudando a las computadoras a realizar la recopilación e investigación de información automatizadas.

Un ejemplo de una etiqueta que se utilizaría en una página web no semántica:

<item> blog </item>

La codificación de información similar en una página web semántica podría verse así:

<item rdf:about= "https://example.org/semantic-web/" > Web semántica </item>  

Tim Berners-Lee denomina a la red resultante de datos vinculados el "Gráfico global gigante" , en contraste con la World Wide Web basada en HTML. Berners-Lee postula que si el pasado era el intercambio de documentos, el futuro es el intercambio de datos . Su respuesta a la pregunta de "cómo" proporciona tres puntos de instrucción. Uno, una URL debe apuntar a los datos. Dos, cualquiera que acceda a la URL debe obtener datos de vuelta. Tres, las relaciones en los datos deben apuntar a URL adicionales con datos.

Etiquetas e identificadores

Las etiquetas , incluidas las categorías jerárquicas y las etiquetas que se agregan y mantienen de forma colaborativa (por ejemplo, con folksonomías ), pueden considerarse parte de, de uso potencial para o un paso hacia la visión de la Web semántica. [15] [16] [17]

Los identificadores únicos , incluidas las categorías jerárquicas y las agregadas de manera colaborativa, las herramientas de análisis (por ejemplo, los algoritmos scite.ai) [18] y los metadatos , incluidas las etiquetas, se pueden utilizar para crear formas de webs semánticas, webs que son hasta cierto punto semánticas. En particular, esto se ha utilizado para estructurar la investigación científica por temas de investigación y campos científicos por los proyectos OpenAlex [ 19] [20] [21] Wikidata y Scholia que están en desarrollo y proporcionan API , páginas web, feeds y gráficos para varias consultas semánticas .

Web 3.0

Tim Berners-Lee ha descrito la Web Semántica como un componente de la Web 3.0. [22]

La gente sigue preguntándose qué es la Web 3.0. Creo que tal vez cuando tengas una superposición de gráficos vectoriales escalables –todo ondulando, plegándose y luciendo borroso– sobre la Web 2.0 y acceso a una Web semántica integrada en un espacio enorme de datos, tendrás acceso a un recurso de datos increíble…

—Tim  Berners-Lee, 2006

"Web Semántica" se utiliza a veces como sinónimo de "Web 3.0", [23] aunque la definición de cada término varía.

Más allá de la Web 3.0

La próxima generación de la Web se suele denominar Web 4.0, pero su definición no es clara. Según algunas fuentes, es una Web que involucra inteligencia artificial , [24] Internet de las cosas , computación generalizada , computación ubicua y la Web de las cosas, entre otros conceptos. [25] Según la Unión Europea, la Web 4.0 es "la cuarta generación esperada de la World Wide Web. Utilizando inteligencia artificial y ambiental avanzada, Internet de las cosas, transacciones confiables de blockchain, mundos virtuales y capacidades XR, los objetos y entornos digitales y reales están completamente integrados y se comunican entre sí, lo que permite experiencias verdaderamente intuitivas e inmersivas, mezclando a la perfección los mundos físico y digital". [26]

Desafíos

Algunos de los desafíos que se le presentan a la Web Semántica son la inmensidad, la vaguedad, la incertidumbre, la inconsistencia y el engaño. Los sistemas de razonamiento automatizado tendrán que lidiar con todos estos problemas para cumplir la promesa de la Web Semántica.

  • Inmensidad: la World Wide Web contiene miles de millones de páginas. La ontología de terminología médica SNOMED CT contiene 370.000 nombres de clases y la tecnología existente aún no ha podido eliminar todos los términos semánticamente duplicados. Cualquier sistema de razonamiento automatizado tendrá que lidiar con entradas realmente enormes.
  • Vaguedad: Son conceptos imprecisos como "joven" o "alto". Esto surge de la vaguedad de las consultas de los usuarios, de los conceptos representados por los proveedores de contenido, de la coincidencia de los términos de consulta con los términos del proveedor y de los intentos de combinar diferentes bases de conocimiento con conceptos superpuestos pero sutilmente diferentes. La lógica difusa es la técnica más común para abordar la vaguedad.
  • Incertidumbre: Son conceptos precisos con valores inciertos. Por ejemplo, un paciente puede presentar un conjunto de síntomas que corresponden a varios diagnósticos distintos, cada uno con una probabilidad diferente. Para abordar la incertidumbre, generalmente se emplean técnicas de razonamiento probabilístico .
  • Inconsistencia: Son contradicciones lógicas que inevitablemente surgirán durante el desarrollo de grandes ontologías y cuando se combinen ontologías de fuentes separadas. El razonamiento deductivo falla catastróficamente cuando se enfrenta a una inconsistencia, porque "todo se sigue de una contradicción" . El razonamiento refutable y el razonamiento paraconsistente son dos técnicas que se pueden emplear para lidiar con la inconsistencia.
  • Engaño: se produce cuando el productor de la información engaña intencionalmente al consumidor de la misma. En la actualidad, se utilizan técnicas de criptografía para mitigar esta amenaza, ya que proporcionan un medio para determinar la integridad de la información, incluida la relacionada con la identidad de la entidad que produjo o publicó la información; sin embargo, aún deben abordarse las cuestiones de credibilidad en casos de posible engaño.

Esta lista de desafíos es ilustrativa, no exhaustiva, y se centra en los desafíos a los que se enfrentan las capas de "lógica unificadora" y "prueba" de la Web semántica. El informe final del Grupo Incubador para el Razonamiento de Incertidumbre para la World Wide Web [27] (URW3-XG) del Consorcio World Wide Web (W3C) agrupa estos problemas bajo el único título de "incertidumbre". [28] Muchas de las técnicas mencionadas aquí requerirán extensiones del Lenguaje de Ontología Web (OWL), por ejemplo, para anotar probabilidades condicionales. Esta es un área de investigación activa. [29]

Normas

La estandarización de la Web Semántica en el contexto de la Web 3.0 está a cargo del W3C. [30]

Componentes

El término "Web semántica" se utiliza a menudo de forma más específica para referirse a los formatos y tecnologías que la hacen posible. [5] La recopilación, estructuración y recuperación de datos vinculados se hace posible gracias a tecnologías que proporcionan una descripción formal de conceptos, términos y relaciones dentro de un dominio de conocimiento determinado . Estas tecnologías se especifican como estándares del W3C e incluyen:

La pila de la Web semántica ilustra la arquitectura de la Web semántica. Las funciones y relaciones de los componentes se pueden resumir de la siguiente manera: [31]

  • XML proporciona una sintaxis elemental para la estructura de contenido dentro de los documentos, pero no asocia ninguna semántica con el significado del contenido incluido en ellos. XML no es actualmente un componente necesario de las tecnologías de la Web semántica en la mayoría de los casos, ya que existen sintaxis alternativas, como Turtle . Turtle es un estándar de facto, pero no ha pasado por un proceso de estandarización formal.
  • El esquema XML es un lenguaje para proporcionar y restringir la estructura y el contenido de los elementos incluidos en documentos XML.
  • RDF es un lenguaje simple para expresar modelos de datos , que hacen referencia a objetos (" recursos web ") y sus relaciones. Un modelo basado en RDF se puede representar en una variedad de sintaxis, por ejemplo, RDF/XML , N3, Turtle y RDFa. RDF es un estándar fundamental de la Web semántica. [32] [33]
  • El esquema RDF extiende RDF y es un vocabulario para describir propiedades y clases de recursos basados ​​en RDF, con semántica para jerarquías generalizadas de dichas propiedades y clases.
  • OWL agrega más vocabulario para describir propiedades y clases: entre otras, relaciones entre clases (por ejemplo, disyunción), cardinalidad (por ejemplo, "exactamente uno"), igualdad, tipificación más rica de propiedades, características de propiedades (por ejemplo, simetría) y clases enumeradas.
  • SPARQL es un protocolo y lenguaje de consulta para fuentes de datos de la web semántica.
  • RIF es el formato de intercambio de reglas del W3C. Es un lenguaje XML para expresar reglas web que las computadoras pueden ejecutar. RIF ofrece múltiples versiones, llamadas dialectos. Incluye un dialecto de lógica básica RIF (RIF-BLD) y un dialecto de reglas de producción RIF (RIF PRD).

Estado actual de la normalización

Estándares bien establecidos:

Aún no se ha realizado plenamente:

Aplicaciones

La intención es mejorar la usabilidad y utilidad de la Web y sus recursos interconectados mediante la creación de servicios web semánticos , como:

  • Servidores que exponen sistemas de datos existentes utilizando los estándares RDF y SPARQL. Existen muchos conversores a RDF de diferentes aplicaciones. [34] Las bases de datos relacionales son una fuente importante. El servidor web semántico se conecta al sistema existente sin afectar su funcionamiento.
  • Documentos "marcados" con información semántica (una extensión de las <meta> etiquetas HTML utilizadas en las páginas web actuales para proporcionar información a los motores de búsqueda web que utilizan rastreadores web ). Esta podría ser información comprensible para las máquinas sobre el contenido comprensible para los humanos del documento (como el creador, el título, la descripción, etc.) o podría ser puramente metadatos que representan un conjunto de hechos (como recursos y servicios en otras partes del sitio). Tenga en cuenta que cualquier cosa que pueda identificarse con un Identificador uniforme de recursos (URI) puede describirse, por lo que la web semántica puede razonar sobre animales, personas, lugares, ideas, etc. Hay cuatro formatos de anotación semántica que se pueden utilizar en documentos HTML: microformato, RDFa, microdatos y JSON-LD . [35] El marcado semántico a menudo se genera automáticamente, en lugar de manualmente.
Argumentos como unidades semánticas distintas con relaciones específicas y control de versiones en Kialo
  • Vocabularios de metadatos comunes ( ontologías ) y mapas entre vocabularios que permiten a los creadores de documentos saber cómo marcar sus documentos para que los agentes puedan usar la información en los metadatos suministrados (de modo que Autor en el sentido de 'el Autor de la página' no se confunda con Autor en el sentido de un libro que es objeto de una reseña).
  • Agentes automatizados para realizar tareas para los usuarios de la web semántica utilizando estos datos.
  • Traducción semántica . Un enfoque alternativo o complementario son las mejoras en la comprensión contextual y semántica de los textos; esto podría lograrse mediante métodos de la Web Semántica, de modo que sólo sea necesario corregir cantidades cada vez más pequeñas de errores de traducción mediante posedición manual o semiautomática .
  • Servicios basados ​​en la Web (a menudo con agentes propios) para suministrar información específicamente a los agentes, por ejemplo, un servicio de confianza al que un agente podría preguntar si alguna tienda en línea tiene un historial de mal servicio o spam .
  • Las ideas de la Web semántica se implementan en sitios de mapeo de argumentos estructurados y colaborativos donde sus relaciones se organizan semánticamente, los argumentos se pueden reflejar (vincular) en múltiples lugares, reutilizar (copiar), calificar y cambiar como unidades semánticas distintas. Las ideas para este tipo de "World Wide Argument Web" o para una más ampliamente adoptada se remontan al menos a 2007 [36] y se han implementado hasta cierto punto en Argüman [37] y Kialo . Otros pasos hacia los servicios de la Web semántica pueden incluir la habilitación de "Consultas", motores de búsqueda de argumentos [38] y "resumen de los puntos polémicos y acordados de una discusión". [39]

Estos servicios podrían ser útiles para los motores de búsqueda públicos o podrían utilizarse para la gestión del conocimiento dentro de una organización. Las aplicaciones empresariales incluyen:

  • Facilitar la integración de información procedente de fuentes mixtas [40]
  • Disolviendo ambigüedades en la terminología corporativa
  • Mejorar la recuperación de información , reduciendo así la sobrecarga de información y aumentando el refinamiento y la precisión de los datos recuperados [41] [42] [43] [44]
  • Identificación de información relevante con respecto a un dominio determinado [45]
  • Proporcionar apoyo para la toma de decisiones

En una corporación, existe un grupo cerrado de usuarios y la gerencia puede hacer cumplir las pautas de la empresa, como la adopción de ontologías específicas y el uso de anotaciones semánticas . En comparación con la Web Semántica pública, existen menores requisitos de escalabilidad y la información que circula dentro de una empresa puede ser más confiable en general; la privacidad es un problema menor fuera del manejo de datos de los clientes.

Reacciones escépticas

Viabilidad práctica

Los críticos cuestionan la viabilidad básica de una implementación completa o incluso parcial de la Web Semántica, señalando tanto las dificultades para su puesta en marcha como la falta de utilidad para fines generales que impide invertir el esfuerzo requerido. En un artículo de 2003, Marshall y Shipman señalan la sobrecarga cognitiva inherente a la formalización del conocimiento, en comparación con la creación de hipertexto web tradicional : [46]

Aunque aprender los conceptos básicos de HTML es relativamente sencillo, aprender un lenguaje o herramienta de representación del conocimiento requiere que el autor aprenda acerca de los métodos de abstracción de la representación y su efecto en el razonamiento. Por ejemplo, comprender la relación clase-instancia, o la relación superclase-subclase, es más que comprender que un concepto es un "tipo de" otro concepto. [...] Estas abstracciones se enseñan a los científicos informáticos en general y a los ingenieros del conocimiento en particular, pero no coinciden con el significado similar del lenguaje natural de ser un "tipo de" algo. El uso eficaz de una representación formal de este tipo requiere que el autor se convierta en un ingeniero del conocimiento experto, además de otras habilidades requeridas por el dominio. [...] Una vez que uno ha aprendido un lenguaje de representación formal, a menudo sigue siendo mucho más esfuerzo expresar ideas en esa representación que en una representación menos formal [...]. De hecho, esta es una forma de programación basada en la declaración de datos semánticos y requiere una comprensión de cómo los algoritmos de razonamiento interpretarán las estructuras creadas.

Según Marshall y Shipman, la naturaleza tácita y cambiante de gran parte del conocimiento se suma al problema de la ingeniería del conocimiento y limita la aplicabilidad de la Web semántica a dominios específicos. Otro problema que señalan son las formas específicas de dominio u organización de expresar el conocimiento, que deben resolverse mediante el acuerdo de la comunidad en lugar de solo medios técnicos. [46] Como resultado, las comunidades y organizaciones especializadas para proyectos intraempresariales han tendido a adoptar tecnologías de la Web semántica en mayor medida que las comunidades periféricas y menos especializadas. [47] Las limitaciones prácticas para la adopción han parecido menos desafiantes donde el dominio y el alcance son más limitados que en el caso del público en general y la World Wide Web. [47]

Finalmente, Marshall y Shipman ven problemas pragmáticos en la idea de agentes inteligentes ( al estilo de Knowledge Navigator ) que trabajan en la Web Semántica, curada en gran medida de forma manual: [46]

En situaciones en las que se conocen las necesidades de los usuarios y los recursos de información distribuidos están bien descritos, este enfoque puede ser muy eficaz; en situaciones que no se prevén y que reúnen una serie imprevista de recursos de información, el enfoque de Google es más sólido. Además, la Web semántica se basa en cadenas de inferencia que son más frágiles; un elemento faltante de la cadena da como resultado un fracaso en la realización de la acción deseada, mientras que el ser humano puede proporcionar las piezas faltantes en un enfoque más parecido al de Google. [...] las compensaciones de costo-beneficio pueden funcionar a favor de metadatos de la Web semántica especialmente creados y dirigidos a entrelazar recursos de información específicos del dominio, bien estructurados y sensibles; una atención minuciosa a las necesidades de los usuarios/clientes impulsará estas federaciones para que tengan éxito.

La crítica de Cory Doctorow (" metacrap ") [48] se basa en la perspectiva del comportamiento humano y las preferencias personales. Por ejemplo, las personas pueden incluir metadatos falsos en las páginas web con el fin de engañar a los motores de la Web semántica, que ingenuamente asumen la veracidad de los metadatos. Este fenómeno era bien conocido con las metaetiquetas que engañaban al algoritmo de clasificación de Altavista para que elevara la clasificación de ciertas páginas web: el motor de indexación de Google busca específicamente este tipo de intentos de manipulación. Peter Gärdenfors y Timo Honkela señalan que las tecnologías de la Web semántica basadas en la lógica cubren solo una fracción de los fenómenos relevantes relacionados con la semántica. [49] [50]

Censura y privacidad

El entusiasmo por la web semántica podría verse atenuado por las preocupaciones en torno a la censura y la privacidad . Por ejemplo, las técnicas de análisis de textos pueden ahora eludirse fácilmente utilizando otras palabras, metáforas por ejemplo, o utilizando imágenes en lugar de palabras. Una implementación avanzada de la web semántica facilitaría mucho a los gobiernos el control de la visualización y creación de información en línea, ya que esta información sería mucho más fácil de entender para una máquina de bloqueo de contenido automatizada. Además, también se ha planteado la cuestión de que, con el uso de archivos FOAF y metadatos de geolocalización , habría muy poco anonimato asociado con la autoría de artículos sobre cosas como un blog personal. Algunas de estas preocupaciones se abordaron en el proyecto "Policy Aware Web" [51] y es un tema de investigación y desarrollo activo.

Duplicación de formatos de salida

Otra crítica a la web semántica es que la creación y publicación de contenido requeriría mucho más tiempo, ya que se necesitarían dos formatos para cada dato: uno para que lo vean los humanos y otro para las máquinas. Sin embargo, muchas aplicaciones web en desarrollo están abordando este problema creando un formato legible por máquinas cuando se publican los datos o cuando una máquina los solicita. El desarrollo de microformatos ha sido una reacción a este tipo de críticas. Otro argumento en defensa de la viabilidad de la web semántica es la probable caída del precio de las tareas de inteligencia humana en los mercados laborales digitales, como el Mechanical Turk de Amazon . [ cita requerida ]

Especificaciones como eRDF y RDFa permiten que se incorporen datos RDF arbitrarios en páginas HTML. El mecanismo GRDDL (Gleaning Resource Descriptions from Dialects of Language) permite que el material existente (incluidos los microformatos) se interprete automáticamente como RDF, de modo que los editores solo tengan que utilizar un único formato, como HTML.

Actividades de investigación sobre aplicaciones corporativas

El primer grupo de investigación que se centró explícitamente en la Web semántica corporativa fue el equipo ACACIA en INRIA-Sophia-Antipolis , fundado en 2002. Los resultados de su trabajo incluyen el motor de búsqueda Corese [52] basado en RDF(S) y la aplicación de la tecnología de la web semántica en el ámbito de la inteligencia artificial distribuida para la gestión del conocimiento (por ejemplo, ontologías y sistemas multiagente para la Web semántica corporativa) [53] y el aprendizaje electrónico . [54]

Desde 2008, el grupo de investigación de la Web Semántica Corporativa, ubicado en la Universidad Libre de Berlín , se centra en los bloques de construcción: Búsqueda Semántica Corporativa, Colaboración Semántica Corporativa e Ingeniería Ontológica Corporativa. [55]

La investigación en ingeniería ontológica incluye la cuestión de cómo involucrar a usuarios no expertos en la creación de ontologías y contenido anotado semánticamente [56] y para extraer conocimiento explícito de la interacción de los usuarios dentro de las empresas.

El futuro de las aplicaciones

Tim O'Reilly , quien acuñó el término Web 2.0, propuso una visión a largo plazo de la Web Semántica como una red de datos, donde aplicaciones sofisticadas navegan y la manipulan. [57] La ​​web de datos transforma la World Wide Web de un sistema de archivos distribuido a una base de datos distribuida . [58]

Véase también

Referencias

  1. ^ Web semántica en el W3C: https://www.w3.org/standards/semanticweb/
  2. ^ "Consorcio World Wide Web (W3C), "Especificación de sintaxis RDF/XML (revisada)", 25 de febrero de 2014".
  3. ^ "Consorcio World Wide Web (W3C), "Descripción general del lenguaje de ontología web OWL", Recomendación del W3C, 10 de febrero de 2004".
  4. ^ Chung, Seung-Hwa (2018). "El enfoque MOUSE: mapeo de ontologías mediante UML para ingenieros de sistemas". Revista Computer Reviews : 8–29. ISSN  2581-6640.
  5. ^ ab "Actividad de Web Semántica del W3C". Consorcio World Wide Web (W3C). 7 de noviembre de 2011. Consultado el 26 de noviembre de 2011 .
  6. ^ "Preguntas y respuestas con Tim Berners-Lee, informe especial". Bloomberg . Consultado el 14 de abril de 2018 .
  7. ^ ab Berners-Lee, Tim; James Hendler; Ora Lassila (17 de mayo de 2001). «The Semantic Web». Scientific American . Consultado el 2 de julio de 2019 .
  8. ^ Lee Feigenbaum (1 de mayo de 2007). «La Web semántica en acción». Scientific American . Consultado el 24 de febrero de 2010 .
  9. ^ Berners-Lee, Tim ; Fischetti, Mark (1999). Tejiendo la red . HarperSanFrancisco . Capítulo 12. ISBN. 978-0-06-251587-2.
  10. ^ Berners-Lee, Tim; Hendler, James; Lassila, Ora (17 de mayo de 2001). «The Semantic Web» (PDF) . Scientific American . Vol. 284, núm. 5. págs. 34–43. JSTOR  26059207. S2CID  56818714. Archivado desde el original (PDF) el 10 de octubre de 2017 . Consultado el 13 de marzo de 2008 .
  11. ^ Nigel Shadbolt; Wendy Hall; Tim Berners-Lee (2006). "The Semantic Web Revisited" (PDF) . IEEE Intelligent Systems . Archivado desde el original (PDF) el 20 de marzo de 2013. Consultado el 13 de abril de 2007 .
  12. ^ Ramanathan V. Guha (2013). "Luz al final del túnel". Conferencia Internacional de Web Semántica 2013. Consultado el 8 de marzo de 2015 .
  13. ^ Allsopp, John (marzo de 2007). Microformatos: potenciando su marcado para la Web 2.0 . Amigos de ED . pág. 368. ISBN. 978-1-59059-814-6.
  14. ^ Artem Chebotko y Shiyong Lu, "Consultas en la Web Semántica: Un Enfoque Eficiente Usando Bases de Datos Relacionales", LAP Lambert Academic Publishing , ISBN 978-3-8383-0264-5 , 2009. 
  15. ^ "Hacia la Web Semántica: Sugerencias de etiquetas colaborativas" (PDF) .
  16. ^ Specia, Lucia; Motta, Enrico (2007). "Integración de folksonomías con la Web semántica". La Web semántica: investigación y aplicaciones . Apuntes de clase en informática. Vol. 4519. Springer. págs. 624–639. doi : 10.1007/978-3-540-72667-8_44 . ISBN. 978-3-540-72666-1.
  17. ^ "Acortando la brecha entre las folksonomías y la web semántica: un informe de experiencia" (PDF) .
  18. ^ Nicholson, Josh M.; Mordaunt, Milo; Lopez, Patrice; Uppala, Ashish; Rosati, Domenic; Rodrigues, Neves P.; Grabitz, Peter; Rife, Sean C. (5 de noviembre de 2021). "scite: Un índice de citas inteligente que muestra el contexto de las citas y clasifica su intención mediante aprendizaje profundo". Estudios de ciencia cuantitativa . 2 (3): 882–898. doi : 10.1162/qss_a_00146 .
  19. ^ Singh Chawla, Dalmeet (24 de enero de 2022). "Se lanza un índice abierto masivo de artículos académicos". Nature . doi :10.1038/d41586-022-00138-y . Consultado el 14 de febrero de 2022 .
  20. ^ "OpenAlex: la alternativa prometedora a Microsoft Academic Graph". Universidad de Gestión de Singapur (SMU) . Consultado el 14 de febrero de 2022 .
  21. ^ "Documentación de OpenAlex" . Consultado el 18 de febrero de 2022 .
  22. ^ Shannon, Victoria (23 de mayo de 2006). «Una web más revolucionaria». International Herald Tribune . Consultado el 26 de junio de 2006 .
  23. ^ "Explicación de la Web 3.0 y la historia de la Web 1.0 y 2.0". Investopedia . Consultado el 21 de octubre de 2022 .
  24. ^ https://www.rsisinternational.org/IJRSI/Issue31/75-78.pdf
  25. ^ Almeida, F. (2017). Concepto y dimensiones de la web 4.0. Revista internacional de informática y tecnología, 16(7).
  26. ^ "La Comisión quiere que la UE lidere la 'Web 4.0', sea lo que sea". 11 de julio de 2023.
  27. ^ "Razonamiento de incertidumbre del W3C para la World Wide Web". www.w3.org . Consultado el 14 de mayo de 2021 .
  28. ^ "Razonamiento de incertidumbre para la World Wide Web". W3.org . Consultado el 20 de diciembre de 2018 .
  29. ^ Lukasiewicz, Thomas; Umberto Straccia (2008). "Gestión de la incertidumbre y la vaguedad en las lógicas descriptivas para la Web semántica" (PDF) . Semántica web: ciencia, servicios y agentes en la World Wide Web . 6 (4): 291–308. doi :10.1016/j.websem.2008.04.001.
  30. ^ "Estándares de la Web Semántica". W3.org . Consultado el 14 de abril de 2018 .
  31. ^ "OWL Web Ontology Language Overview". Consorcio World Wide Web (W3C). 10 de febrero de 2004. Consultado el 26 de noviembre de 2011 .
  32. ^ "Marco de descripción de recursos (RDF)". Consorcio World Wide Web .
  33. ^ Allemang, Dean; Hendler, James; Gandon, Fabien (3 de agosto de 2020). Web semántica para el ontólogo en activo: modelado eficaz para datos vinculados, RDFS y OWL (tercera edición). [Nueva York, NY, EE. UU.]: ACM Books; 3.ª edición. ISBN 978-1450376143.
  34. ^ "ConverterToRdf - Wiki del W3C". W3.org . Consultado el 20 de diciembre de 2018 .
  35. ^ Sikos, Leslie F. (2015). Dominar los datos estructurados en la Web semántica: de los microdatos HTML5 a los datos abiertos vinculados . Apress. p. 23. ISBN 978-1-4842-1049-9.
  36. ^ Kiesel, Johannes; Lang, Kevin; Wachsmuth, Henning; Hornecker, Eva; Stein, Benno (14 de marzo de 2020). "Investigación de las expectativas para la búsqueda de argumentos conversacionales y basados ​​en la voz en la Web". Actas de la Conferencia de 2020 sobre la interacción y recuperación de información humana . ACM. págs. 53–62. doi :10.1145/3343413.3377978. ISBN. 9781450368926.S2CID212676751  .
  37. ^ Vetere, Guido (30 de junio de 2018). "L'impossibile necessità delle piattaforme sociali descentralizzate". DigitCult - Revista Científica sobre Culturas Digitales . 3 (1): 41–50. doi : 10.4399/97888255159096.
  38. ^ Bikakis, Antonis; Flouris, Giorgos; Patkos, Theodore; Plexousakis, Dimitris (2023). "Esbozando la visión de la Web de Debates". Fronteras en Inteligencia Artificial . 6 . doi : 10.3389/frai.2023.1124045 . ISSN  2624-8212. PMC 10313200 . PMID  37396970. 
  39. ^ Schneider, Jodi; Groza, Tudor; Passant, Alexandre. "Una revisión de la argumentación para la Web semántica social" (PDF) . {{cite journal}}: Requiere citar revista |journal=( ayuda )
  40. ^ Zhang, Chuanrong; Zhao, Tian; Li, Weidong (2015). Web semántica geoespacial . Springer International Publishing : Sello editorial: Springer. ISBN 978-3-319-17801-1.
  41. ^ Omar Alonso y Hugo Zaragoza. 2008. Explotación de anotaciones semánticas en la recuperación de información: ESAIR '08. SIGIR Forum 42, 1 (junio de 2008), 55–58. doi :10.1145/1394251.1394262
  42. ^ Jaap Kamps, Jussi Karlgren y Ralf Schenkel. 2011. Informe del tercer taller sobre explotación de anotaciones semánticas en la recuperación de información (ESAIR). SIGIR Forum 45, 1 (mayo de 2011), 33–41. doi :10.1145/1988852.1988858
  43. ^ Jaap Kamps, Jussi Karlgren , Peter Mika y Vanessa Murdock. 2012. Quinto taller sobre la explotación de anotaciones semánticas en la recuperación de información: ESAIR '12). En Actas de la 21.ª conferencia internacional de la ACM sobre gestión de la información y el conocimiento (CIKM '12). ACM, Nueva York, NY, EE. UU., 2772–2773. doi :10.1145/2396761.2398761
  44. ^ Omar Alonso, Jaap Kamps y Jussi Karlgren . 2015. Informe del Séptimo Taller sobre Explotación de Anotaciones Semánticas en la Recuperación de Información (ESAIR '14). SIGIR Forum 49, 1 (junio de 2015), 27–34. doi :10.1145/2795403.2795412
  45. ^ Kuriakose, John (septiembre de 2009). "Comprensión y adopción de la tecnología de la Web semántica". Cutter IT Journal . 22 (9). CUTTER INFORMATION CORP.: 10–18.
  46. ^ abc Marshall, Catherine C.; Shipman, Frank M. (2003). ¿Qué web semántica? (PDF) . Proc. ACM Conf. on Hypertext and Hypermedia. págs. 57–66. Archivado desde el original (PDF) el 23 de septiembre de 2015. Consultado el 17 de abril de 2015 .
  47. ^ por Ivan Herman (2007). Estado de la Web Semántica (PDF) . Semantic Days 2007. Consultado el 26 de julio de 2007 .
  48. ^ Doctorow, Cory. "Metacrap: prendiendo fuego a siete hombres de paja de la metautopía". www.well.com/ . Consultado el 11 de septiembre de 2023 .
  49. ^ Gärdenfors, Peter (2004). Cómo hacer que la Web semántica sea más semántica . IOS Press. pp. 17–34. {{cite book}}: |work=ignorado ( ayuda )
  50. ^ Honkela, Timo; Könönen, Ville; Lindh-Knuutila, Tiina; Paukkeri, Mari-Sanna (2008). "Simulando procesos de formación y comunicación de conceptos". Revista de Metodología Económica . 15 (3): 245–259. doi :10.1080/13501780802321350. S2CID  16994027.
  51. ^ "Proyecto Web que respeta las políticas". Policyawareweb.org . Consultado el 14 de junio de 2013 .
  52. ^ Corby, Olivier; Dieng-Kuntz, Rose; Zucker, Catherine Faron; Gandon, Fabien (2006). "Búsqueda en la Web semántica: procesamiento aproximado de consultas basado en ontologías". IEEE Intelligent Systems . 21 : 20–27. doi :10.1109/MIS.2006.16. S2CID  11488848.
  53. ^ Gandon, Fabien (7 de noviembre de 2002). Inteligencia artificial distribuida y gestión del conocimiento: ontologías y sistemas multiagente para una web semántica corporativa (tesis doctoral). Université Nice Sophia Antipolis.
  54. ^ Buffa, Michel; Dehors, Sylvain; Faron-Zucker, Catherine; Sander, Peter (2005). "Hacia un enfoque de Web semántica corporativa en el diseño de sistemas de aprendizaje: revisión del proyecto Trial Solutioins" (PDF) . Taller internacional sobre aplicaciones de tecnologías de Web semántica para el aprendizaje electrónico . Ámsterdam, Holanda. pp. 73–76.
  55. ^ "Web semántica corporativa - Página de inicio". Corporate-semantic-web.de . Consultado el 14 de abril de 2018 .
  56. ^ Hinze, Annika; Heese, Ralf; Luczak-Rösch, Markus; Paschke, Adrian (2012). "Enriquecimiento semántico por parte de no expertos: usabilidad de las herramientas de anotación manual" (PDF) . ISWC'12 - Actas de la 11.ª conferencia internacional sobre la Web semántica . Boston, EE. UU., págs. 165–181.
  57. ^ Mathieson, SA (6 de abril de 2006). "Difunde la palabra y únete a ella". The Guardian . Consultado el 14 de abril de 2018 .
  58. ^ Spivack, Nova (18 de septiembre de 2007). "La Web semántica, la inteligencia colectiva y los hiperdatos". novaspivack.typepad.com/nova_spivacks_weblog [Este blog se ha trasladado a NovaSpivack.com] . Consultado el 14 de abril de 2018 .

Lectura adicional

  • Liyang Yu (14 de diciembre de 2014). Guía para desarrolladores de la Web semántica, 2.ª edición, Springer. ISBN 978-3-662-43796-4.
  • Una web programable de Aaron Swartz: una obra inacabada donada por Morgan & Claypool Publishers después de la muerte de Aaron Swartz en enero de 2013.
  • Grigoris Antoniou, Frank van Harmelen (31 de marzo de 2008). Introducción a la web semántica, segunda edición . La prensa del MIT . ISBN 978-0-262-01242-3.
  • Allemang, Dean; Hendler, James; Gandon, Fabien (3 de agosto de 2020). Web semántica para el ontólogo en activo: modelado eficaz para datos vinculados, RDFS y OWL (tercera edición). [Nueva York, NY, EE. UU.]: ACM Books; 3.ª edición. ISBN 978-1450376143.
  • Pascal Hitzler ; Markus Krötzsch; Sebastian Rudolph (25 de agosto de 2009). Fundamentos de las tecnologías de la Web semántica. CRCPress. ISBN 978-1-4200-9050-5.
  • Thomas B. Passin (1 de marzo de 2004). Guía del explorador de la Web semántica . Publicaciones Manning. ISBN 978-1-932394-20-7.
  • Jeffrey T. Pollock (23 de marzo de 2009). Web semántica para principiantes . Para principiantes. ISBN 978-0-470-39679-7.
  • Hitzler, Pascal (febrero de 2021). "Una revisión del campo de la Web semántica". Comunicaciones de la ACM . 64 (2): 76–83. doi : 10.1145/3397512 .
  • Unni, Deepak (marzo de 2023). "FAIRificación de datos relacionados con la salud mediante tecnologías de la web semántica en la red suiza de salud personalizada". Datos científicos . 10 (1): 127. Bibcode :2023NatSD..10..127T. doi :10.1038/s41597-023-02028-y. PMC  10006404 . PMID  36899064.
  • Sitio web oficial
Retrieved from "https://en.wikipedia.org/w/index.php?title=Semantic_Web&oldid=1250635812"