De Wikipedia, la enciclopedia libre
Saltar a navegación Saltar a búsqueda

La Web Semántica es una extensión de la World Wide Web a través de estándares establecidos por el Consorcio World Wide Web (W3C). [1] El objetivo de la Web Semántica es hacer que los datos de Internet sean legibles por máquinas.

Para permitir la codificación de la semántica con los datos, se utilizan tecnologías como Resource Description Framework (RDF) [2] y Web Ontology Language (OWL) [3] . Estas tecnologías se utilizan para representar formalmente metadatos . Por ejemplo, la ontología puede describir conceptos, relaciones entre entidades y categorías de cosas. Esta semántica incorporada ofrece ventajas significativas, como razonar sobre los datos y operar con fuentes de datos heterogéneas. [4]

Estos estándares promueven formatos de datos comunes y protocolos de intercambio en la Web, fundamentalmente el RDF. Según el W3C, "La Web Semántica proporciona un marco común que permite que los datos se compartan y reutilicen en los límites de la aplicación, la empresa y la comunidad". [5] Por lo tanto, la Web Semántica se considera un integrador de diferentes aplicaciones y sistemas de contenido e información.

El término fue acuñado por Tim Berners-Lee para referirse a una red de datos (o red de datos ) [6] que puede ser procesada por máquinas [7] , es decir, una en la que gran parte del significado es legible por máquina . Si bien sus críticos han cuestionado su viabilidad, los defensores argumentan que las aplicaciones en bibliotecas y ciencias de la información, la industria, la biología y la investigación en ciencias humanas ya han demostrado la validez del concepto original. [8]

Berners-Lee expresó originalmente su visión de la Web Semántica en 1999 de la siguiente manera:

Tengo un sueño para la Web [en el que las computadoras] sean capaces de analizar todos los datos de la Web: el contenido, los enlaces y las transacciones entre las personas y las computadoras. Una "Web Semántica", que lo haga posible, aún no ha surgido, pero cuando lo haga, los mecanismos cotidianos del comercio, la burocracia y nuestra vida diaria serán manejados por máquinas que hablan con máquinas. Los " agentes inteligentes " que la gente ha promocionado durante siglos finalmente se materializarán. [9]

El artículo de 2001 de Scientific American de Berners-Lee, Hendler y Lassila describió una evolución esperada de la Web existente a una Web Semántica. [10] En 2006, Berners-Lee y sus colegas declararon que: "Esta simple idea ... permanece en gran parte sin realizar". [11] En 2013, más de cuatro millones de dominios web contenían marcado de web semántica. [12]

Ejemplo [ editar ]

En el siguiente ejemplo, se anotará el texto "Paul Schuster nació en Dresde" en un sitio web, conectando a una persona con su lugar de nacimiento. Los siguientes HTML muestra fragmento cómo se está describiendo una pequeña gráfica, en RDFa -Sintaxis usando un schema.org vocabulario y un Wikidata ID:

< div  vocab = "https://schema.org/"  typeof = "Person" >  < span  property = "name" > Paul Schuster </ span > nació en < span  property = "birthPlace"  typeof = "Place"  href = "https://www.wikidata.org/entity/Q1731" >  < span  property = "name" > Dresde </ span > . </ intervalo > </div >
Gráfico resultante del ejemplo RDFa

El ejemplo define los siguientes cinco triples (que se muestran en la sintaxis de Turtle ). Cada triple representa un borde en el gráfico resultante: el primer elemento del triple (el sujeto ) es el nombre del nodo donde comienza el borde, el segundo elemento (el predicado ) el tipo de borde y el último y tercer elemento (el objeto ) ya sea el nombre del nodo donde termina el borde o un valor literal (por ejemplo, un texto, un número, etc.).

Los triples dan como resultado el gráfico que se muestra en la figura dada .

Gráfico resultante del ejemplo RDFa, enriquecido con más datos de la Web

Una de las ventajas de usar identificadores uniformes de recursos (URI) es que se pueden desreferenciar mediante el protocolo HTTP . De acuerdo con los llamados principios de Datos Abiertos Vinculados , tal URI desreferenciado debería resultar en un documento que ofrezca más datos sobre el URI dado. En este ejemplo, todos los URI, tanto para los bordes como para los nodos (p http://schema.org/Person. Ej . http://schema.org/birthPlace, http://www.wikidata.org/entity/Q1731) Se pueden desreferenciar y darán como resultado más gráficos RDF, que describen el URI, p. Ej., Que Dresde es una ciudad en Alemania, o que una persona, en el sentido de ese URI, puede ser ficticio.

El segundo gráfico muestra el ejemplo anterior, pero ahora está enriquecido con algunos de los triples de los documentos que resultan de la eliminación de referencias https://schema.org/Person(borde verde) y https://www.wikidata.org/entity/Q1731(bordes azules).

Además de los bordes dados en los documentos involucrados explícitamente, los bordes se pueden inferir automáticamente: el triple

del fragmento RDFa original y el triple

del documento en https://schema.org/Person(borde verde en la Figura) permiten inferir el siguiente triple, dada la semántica de OWL (línea discontinua roja en la segunda Figura):

Antecedentes [ editar ]

El concepto del modelo de red semántica fue formado a principios de la década de 1960 por investigadores como el científico cognitivo Allan M. Collins , el lingüista M. Ross Quillian y la psicóloga Elizabeth F. Loftus como una forma de representar el conocimiento semánticamente estructurado. Cuando se aplica en el contexto de la Internet moderna, amplía la red de páginas web legibles por humanos con hipervínculos al insertar metadatos legibles por máquina sobre las páginas y cómo se relacionan entre sí. Esto permite que los agentes automatizados accedan a la Web de forma más inteligente y realicen más tareas en nombre de los usuarios. El término "Web semántica" fue acuñado por Tim Berners-Lee , [7]inventor de la World Wide Web y director del Consorcio World Wide Web (" W3C "), que supervisa el desarrollo de los estándares propuestos para la Web Semántica. Define la Web Semántica como "una red de datos que pueden ser procesados ​​directa e indirectamente por máquinas".

Muchas de las tecnologías propuestas por el W3C ya existían antes de que se colocaran bajo el paraguas del W3C. Estos se utilizan en varios contextos, en particular aquellos que tratan con información que abarca un dominio limitado y definido, y donde compartir datos es una necesidad común, como la investigación científica o el intercambio de datos entre empresas. Además, han surgido otras tecnologías con objetivos similares, como los microformatos .

Limitaciones de HTML [ editar ]

Muchos archivos en una computadora típica también se pueden dividir libremente en documentos legibles por humanos y datos legibles por máquinas . Los humanos leen documentos como mensajes de correo, informes y folletos. Los datos, como calendarios, libretas de direcciones, listas de reproducción y hojas de cálculo, se presentan mediante un programa de aplicación que permite verlos, buscarlos y combinarlos.

Actualmente, la World Wide Web se basa principalmente en documentos escritos en lenguaje de marcado de hipertexto ( HTML ), una convención de marcado que se utiliza para codificar un cuerpo de texto intercalado con objetos multimedia como imágenes y formularios interactivos. Las etiquetas de metadatos proporcionan un método mediante el cual las computadoras pueden categorizar el contenido de las páginas web. En los ejemplos siguientes, a los nombres de campo "palabras clave", "descripción" y "autor" se les asignan valores como "informática", "widgets baratos a la venta" y "John Doe".

< meta  name = "keywords"  content = "informática, estudios de informática, informática"  /> < meta  name = "description"  content = "Venta de widgets baratos"  /> < meta  name = "author"  content = "John Doe"  / >

Debido a este etiquetado y categorización de metadatos, otros sistemas informáticos que quieran acceder y compartir estos datos pueden identificar fácilmente los valores relevantes.

Con HTML y una herramienta para representarlo (tal vez un software de navegador web , tal vez otro agente de usuario ), se puede crear y presentar una página que enumere los artículos a la venta. El HTML de esta página de catálogo puede hacer afirmaciones simples a nivel de documento, como "el título de este documento es 'Widget Superstore '", pero no hay capacidad dentro del propio HTML para afirmar sin ambigüedades que, por ejemplo, el número de artículo X586172 es un Acme Gizmo con un precio minorista de 199 €, o que es un producto de consumo. Más bien, HTML solo puede decir que el el espacio de texto "X586172" es algo que debe colocarse cerca de "Acme Gizmo" y "199 €", etc. No hay forma de decir "esto es un catálogo" o incluso establecer que "Acme Gizmo" es una especie de título o que "199 €" es un precio.Tampoco hay forma de expresar que estas piezas de información están unidas para describir un artículo discreto, distinto de otros artículos que quizás se enumeran en la página.

HTML semántico se refiere a la práctica tradicional de HTML de marcado siguiendo la intención, en lugar de especificar los detalles del diseño directamente. Por ejemplo, el uso de <em>denotar "énfasis" en lugar de <i>, que especifica cursiva . Los detalles del diseño se dejan en manos del navegador, en combinación con las hojas de estilo en cascada . Pero esta práctica no llega a especificar la semántica de objetos como artículos a la venta o precios.

Los microformatos amplían la sintaxis HTML para crear marcas semánticas legibles por máquina sobre objetos, incluidas personas, organizaciones, eventos y productos. [13] Iniciativas similares incluyen RDFa, Microdata y Schema.org.

Soluciones de web semántica [ editar ]

La Web Semántica lleva la solución más allá. Implica la publicación en lenguajes diseñados específicamente para datos: Resource Description Framework (RDF), Web Ontology Language (OWL) y Extensible Markup Language ( XML ). HTML describe los documentos y los vínculos entre ellos. RDF, OWL y XML, por el contrario, pueden describir cosas arbitrarias como personas, reuniones o partes de aviones.

Estas tecnologías se combinan para proporcionar descripciones que complementen o reemplacen el contenido de los documentos web. Por lo tanto, el contenido puede manifestarse como datos descriptivos almacenados en bases de datos accesibles desde la Web , [14] o como marcado dentro de documentos (particularmente, en HTML extensible ( XHTML ) intercalado con XML o, más a menudo, puramente en XML, con diseño o renderizado. señales almacenadas por separado). Las descripciones legibles por máquina permiten a los administradores de contenido agregar significado al contenido, es decir, describir la estructura del conocimiento que tenemos sobre ese contenido. De esta manera, una máquina puede procesar el conocimiento en sí misma, en lugar del texto, utilizando procesos similares al razonamiento deductivo e inferencia humanos., obteniendo así resultados más significativos y ayudando a las computadoras a realizar búsquedas e investigaciones automatizadas de información.

Un ejemplo de una etiqueta que se usaría en una página web no semántica:

<item> blog </item>

La codificación de información similar en una página web semántica podría tener este aspecto:

<item  rdf: about = "https://example.org/semantic-web/" > Web semántica </item>

Tim Berners-Lee llama a la red resultante de Linked Data el Giant Global Graph , en contraste con la World Wide Web basada en HTML . Berners-Lee postula que si el pasado fue el intercambio de documentos, el futuro es el intercambio de datos . Su respuesta a la pregunta de "cómo" proporciona tres puntos de instrucción. Uno, una URL debe apuntar a los datos. Dos, cualquiera que acceda a la URL debería recuperar los datos. Tres, las relaciones en los datos deben apuntar a URL adicionales con datos.

Web 3.0 [ editar ]

Tim Berners-Lee ha descrito la Web Semántica como un componente de Web 3.0 . [15]

La gente sigue preguntando qué es la Web 3.0. Creo que tal vez cuando tenga una superposición de gráficos vectoriales escalables , todo ondulado, plegado y con aspecto borroso, en la Web 2.0 y acceso a una Web semántica integrada en un gran espacio de datos, tendrá acceso a un recurso de datos increíble. ...

-  Tim Berners-Lee, 2006

"Web semántica" se utiliza a veces como sinónimo de "Web 3.0", [16] aunque la definición de cada término varía. Web 3.0 ha comenzado a surgir como un movimiento que se aleja de la centralización de servicios como la búsqueda, las redes sociales y las aplicaciones de chat que dependen de una sola organización para funcionar. [17]

El periodista de The Guardian , John Harris, revisófavorablemente el concepto de Web 3.0 a principios de 2019 y, en particular, el trabajo de Berners-Lee en un proyecto llamado Solid , basado en almacenes de datos personales o "pods", sobre los cuales las personas mantienen el control. [18] Berners-Lee ha creado una startup, Inrupt, para promover la idea y atraer desarrolladores voluntarios. [19] [20]

Desafíos [ editar ]

Algunos de los desafíos para la Web Semántica incluyen inmensidad, vaguedad, incertidumbre, inconsistencia y engaño. Los sistemas de razonamiento automatizados tendrán que lidiar con todos estos problemas para cumplir la promesa de la Web Semántica.

  • Vastedad: La World Wide Web contiene muchos miles de millones de páginas. La SNOMED CT terminología médica ontología solo contiene 370.000 nombres de las clases, y la tecnología existente aún no ha sido capaz de eliminar todos los términos semánticamente duplicados. Cualquier sistema de razonamiento automatizado tendrá que lidiar con entradas realmente enormes.
  • Vaguedad: Son conceptos imprecisos como "joven" o "alto". Esto surge de la vaguedad de las consultas de los usuarios, de los conceptos representados por los proveedores de contenido, de hacer coincidir los términos de la consulta con los términos del proveedor y de intentar combinar diferentes bases de conocimiento con conceptos superpuestos pero sutilmente diferentes. La lógica difusa es la técnica más común para lidiar con la vaguedad.
  • Incertidumbre: Son conceptos precisos con valores inciertos. Por ejemplo, un paciente puede presentar un conjunto de síntomas que correspondan a varios diagnósticos distintos, cada uno con una probabilidad diferente. Las técnicas de razonamiento probabilístico se emplean generalmente para abordar la incertidumbre.
  • Inconsistencia: estas son contradicciones lógicas que inevitablemente surgirán durante el desarrollo de grandes ontologías y cuando se combinan ontologías de fuentes independientes. El razonamiento deductivo falla catastróficamente cuando se enfrenta a la inconsistencia, porque "todo se sigue de una contradicción" . El razonamiento derrotable y el razonamiento paraconsistente son dos técnicas que se pueden emplear para tratar la inconsistencia.
  • Engaño: esto es cuando el productor de la información engaña intencionalmente al consumidor de la información. Actualmente se utilizan técnicas de criptografía para aliviar esta amenaza. Al proporcionar un medio para determinar la integridad de la información, incluido el que se relaciona con la identidad de la entidad que produjo o publicó la información, sin embargo, los problemas de credibilidad aún deben abordarse en casos de posible engaño.

Esta lista de desafíos es ilustrativa más que exhaustiva, y se centra en los desafíos a las capas de "lógica unificadora" y "prueba" de la Web Semántica. El informe final del Grupo Incubadora de Razonamiento de Incertidumbre para la World Wide Web (URW3-XG) del World Wide Web Consortium (W3C) agrupa estos problemas bajo el único título de "incertidumbre". [21] Muchas de las técnicas mencionadas aquí requerirán extensiones del Lenguaje de Ontología Web (OWL), por ejemplo, para anotar probabilidades condicionales. Ésta es un área de investigación activa. [22]

Estándares [ editar ]

La estandarización de la Web Semántica en el contexto de la Web 3.0 está a cargo del W3C. [23]

Componentes [ editar ]

El término "Web Semántica" se usa a menudo de manera más específica para referirse a los formatos y tecnologías que lo habilitan. [5] La recopilación, estructuración y recuperación de datos vinculados están habilitadas por tecnologías que proporcionan una descripción formal de conceptos, términos y relaciones dentro de un dominio de conocimiento dado . Estas tecnologías se especifican como estándares W3C e incluyen:

  • Marco de descripción de recursos (RDF), un método general para describir información
  • Esquema RDF (RDFS)
  • Sistema simple de organización del conocimiento (SKOS)
  • SPARQL , un lenguaje de consulta RDF
  • Notación3 (N3), diseñado teniendo en cuenta la legibilidad humana
  • N-Triples , un formato para almacenar y transmitir datos
  • Tortuga (Terse RDF Triple Lenguaje)
  • Web Ontology Language (OWL), una familia de lenguajes de representación del conocimiento
  • Formato de intercambio de reglas (RIF), un marco de dialectos del lenguaje de reglas web que admite el intercambio de reglas en la web
La pila de web semántica

La pila de Web semántica ilustra la arquitectura de la Web semántica. Las funciones y relaciones de los componentes se pueden resumir de la siguiente manera: [24]

  • XML proporciona una sintaxis elemental para la estructura del contenido dentro de los documentos, pero no asocia semántica con el significado del contenido que contiene. XML no es en la actualidad un componente necesario de las tecnologías de Web Semántica en la mayoría de los casos, ya que existen sintaxis alternativas, como Turtle . Turtle es un estándar de facto, pero no ha pasado por un proceso de estandarización formal.
  • XML Schema es un lenguaje para proporcionar y restringir la estructura y el contenido de los elementos incluidos en los documentos XML.
  • RDF es un lenguaje simple para expresar modelos de datos , que se refieren a objetos (" recursos web ") y sus relaciones. Un modelo basado en RDF se puede representar en una variedad de sintaxis, por ejemplo, RDF / XML, N3, Turtle y RDFa. RDF es un estándar fundamental de la Web Semántica. [25] [26]
  • RDF Schema extiende RDF y es un vocabulario para describir propiedades y clases de recursos basados ​​en RDF, con semántica para jerarquías generalizadas de tales propiedades y clases.
  • OWL agrega más vocabulario para describir propiedades y clases: entre otros, relaciones entre clases (por ejemplo, disjunción), cardinalidad (por ejemplo, "exactamente una"), igualdad, tipificación más rica de propiedades, características de propiedades (por ejemplo, simetría) y clases enumeradas.
  • SPARQL es un protocolo y lenguaje de consulta para fuentes de datos web semánticas.
  • RIF es el formato de intercambio de reglas del W3C. Es un lenguaje XML para expresar reglas web que las computadoras pueden ejecutar. RIF proporciona múltiples versiones, llamadas dialectos. Incluye un dialecto lógico básico RIF (RIF-BLD) y un dialecto de reglas de producción RIF (RIF PRD).

Estado actual de la estandarización [ editar ]

Estándares bien establecidos:

  • RDF
  • RDFS
  • Formato de intercambio de reglas (RIF)
  • SPARQL
  • Unicode
  • Identificador uniforme de recursos
  • Lenguaje de ontología web (OWL)
  • XML

Aún no se ha realizado del todo:

  • Unificando capas de lógica y prueba
  • Lenguaje de reglas de web semántica (SWRL)

Aplicaciones [ editar ]

La intención es mejorar la usabilidad y utilidad de la Web y sus recursos interconectados mediante la creación de servicios web semánticos , tales como:

  • Servidores que exponen los sistemas de datos existentes utilizando los estándares RDF y SPARQL. Existen muchos convertidores a RDF de diferentes aplicaciones. [27] Las bases de datos relacionales son una fuente importante. El servidor web semántico se conecta al sistema existente sin afectar su funcionamiento.
  • Documentos "marcados" con información semántica (una extensión de las <meta> etiquetas HTML que se utilizan en las páginas web actuales para proporcionar información a los motores de búsqueda web que utilizan rastreadores web ). Esto podría ser información comprensible por máquina sobre el contenido comprensible para humanos del documento (como el creador, título, descripción, etc.) o podría ser puramente metadatos que representen un conjunto de hechos (como recursos y servicios en otras partes del sitio). ). Tenga en cuenta que todo lo que pueda identificarse con un identificador uniforme de recursos(URI) se puede describir, por lo que la web semántica puede razonar sobre animales, personas, lugares, ideas, etc. Hay cuatro formatos de anotaciones semánticas que se pueden usar en documentos HTML; Microformato, RDFa, Microdatos y JSON-LD . [28] El marcado semántico a menudo se genera automáticamente, en lugar de hacerlo manualmente.
  • Vocabularios de metadatos comunes ( ontologías ) y mapas entre vocabularios que permiten a los creadores de documentos saber cómo marcar sus documentos para que los agentes puedan usar la información en los metadatos proporcionados (de modo que el Autor en el sentido de 'el Autor de la página' ganó ' No debe confundirse con Autor en el sentido de un libro que es objeto de una reseña de un libro).
  • Agentes automatizados para realizar tareas para los usuarios de la web semántica utilizando estos datos.
  • Servicios basados ​​en la web (a menudo con agentes propios) para proporcionar información específicamente a los agentes, por ejemplo, un servicio de confianza que un agente podría preguntar si alguna tienda en línea tiene un historial de servicio deficiente o spam .

Estos servicios podrían ser útiles para los motores de búsqueda públicos o podrían utilizarse para la gestión del conocimiento dentro de una organización. Las aplicaciones comerciales incluyen:

  • Facilitar la integración de información de fuentes mixtas
  • Disolver ambigüedades en la terminología corporativa
  • Mejorar la recuperación de información reduciendo así la sobrecarga de información y aumentando el refinamiento y precisión de los datos recuperados [29] [30] [31] [32]
  • Identificación de información relevante con respecto a un dominio dado [33]
  • Brindar apoyo para la toma de decisiones

En una corporación, hay un grupo cerrado de usuarios y la gerencia puede hacer cumplir las pautas de la empresa, como la adopción de ontologías específicas y el uso de anotaciones semánticas . En comparación con la Web Semántica pública, existen menores requisitos de escalabilidad y la información que circula dentro de una empresa puede ser más confiable en general; la privacidad es un problema menor fuera del manejo de los datos del cliente.

Reacciones escépticas [ editar ]

Viabilidad práctica [ editar ]

Los críticos cuestionan la viabilidad básica de un cumplimiento total o incluso parcial de la Web Semántica, señalando tanto las dificultades para configurarla como la falta de utilidad general que impide invertir el esfuerzo requerido. En un artículo de 2003, Marshall y Shipman señalan la sobrecarga cognitiva inherente a la formalización del conocimiento, en comparación con la autoría del hipertexto web tradicional : [34]

Si bien aprender los conceptos básicos de HTML es relativamente sencillo, aprender un lenguaje o herramienta de representación del conocimiento requiere que el autor aprenda sobre los métodos de abstracción de la representación y su efecto sobre el razonamiento. Por ejemplo, comprender la relación clase-instancia, o la relación superclase-subclase, es más que comprender que un concepto es un "tipo de" otro concepto. […] Estas abstracciones se enseñan a los científicos informáticos en general y a los ingenieros del conocimiento específicamente, pero no coinciden con el significado similar del lenguaje natural de ser un "tipo de" algo. El uso efectivo de tal representación formal requiere que el autor se convierta en un ingeniero de conocimiento calificado además de cualquier otra habilidad requerida por el dominio. […] Una vez que uno ha aprendido un lenguaje de representación formal,Todavía es a menudo mucho más esfuerzo expresar ideas en esa representación que en una representación menos formal […]. De hecho, esta es una forma de programación basada en la declaración de datos semánticos y requiere una comprensión de cómo los algoritmos de razonamiento interpretarán las estructuras creadas.

Según Marshall y Shipman, la naturaleza tácita y cambiante de gran parte del conocimiento se suma al problema de la ingeniería del conocimiento y limita la aplicabilidad de la Web Semántica a dominios específicos. Otro problema que señalan son las formas específicas de dominio u organización para expresar el conocimiento, que deben resolverse a través del acuerdo de la comunidad en lugar de solo medios técnicos. [34] Como resultado, las comunidades y organizaciones especializadas para proyectos intraempresariales han tendido a adoptar tecnologías de web semántica más que las comunidades periféricas y menos especializadas. [35] Las limitaciones prácticas para la adopción han parecido menos desafiantes donde el dominio y el alcance son más limitados que el del público en general y la World-Wide Web.[35]

Finalmente, Marshall y Shipman ven problemas pragmáticos en la idea de agentes inteligentes (al estilo de Knowledge Navigator ) que trabajan en la Web Semántica en gran parte seleccionada manualmente: [34]

En situaciones en las que se conocen las necesidades de los usuarios y los recursos de información distribuidos están bien descritos, este enfoque puede ser muy eficaz; en situaciones que no están previstas y que reúnen una serie de recursos de información imprevistos, el enfoque de Google es más sólido. Además, la Web Semántica se basa en cadenas de inferencia que son más frágiles; un elemento faltante de la cadena da como resultado una falla en la realización de la acción deseada, mientras que el humano puede suministrar las piezas faltantes en un enfoque más parecido a Google. […] Las compensaciones de costo-beneficio pueden funcionar a favor de metadatos de Web Semántica especialmente creados, dirigidos a entretejer recursos de información sensibles, bien estructurados y específicos del dominio; Una atención especial a las necesidades de los usuarios / clientes impulsará a estas federaciones para que tengan éxito.

La crítica de Cory Doctorow (" metacrap ") es desde la perspectiva del comportamiento humano y las preferencias personales. Por ejemplo, las personas pueden incluir metadatos falsos en páginas web en un intento de engañar a los motores de la web semántica que asumen ingenuamente la veracidad de los metadatos. Este fenómeno era bien conocido con las metaetiquetas que engañaban al algoritmo de clasificación de Altavista para elevar la clasificación de ciertas páginas web: el motor de indexación de Google busca específicamente tales intentos de manipulación. Peter Gärdenfors y Timo Honkela señalan que las tecnologías web semánticas basadas en la lógica cubren solo una fracción de los fenómenos relevantes relacionados con la semántica. [36] [37]

Censura y privacidad [ editar ]

El entusiasmo por la web semántica podría verse atenuado por preocupaciones sobre la censura y la privacidad . Por ejemplo, las técnicas de análisis de texto ahora se pueden eludir fácilmente usando otras palabras, metáforas, por ejemplo, o usando imágenes en lugar de palabras. Una implementación avanzada de la web semántica facilitaría mucho a los gobiernos el control de la visualización y creación de información en línea, ya que esta información sería mucho más fácil de entender para una máquina automatizada de bloqueo de contenido. Además, también se ha planteado la cuestión de que, con el uso de archivos FOAF y metadatos de geolocalización, habría muy poco anonimato asociado con la autoría de artículos sobre cosas como un blog personal. Algunas de estas preocupaciones se abordaron en el proyecto "Policy Aware Web" [38] y es un tema activo de investigación y desarrollo.

Duplicar formatos de salida [ editar ]

Otra crítica a la web semántica es que llevaría mucho más tiempo crear y publicar contenido porque se necesitarían dos formatos para un dato: uno para visualización humana y otro para máquinas. Sin embargo, muchas aplicaciones web en desarrollo están abordando este problema mediante la creación de un formato legible por máquina tras la publicación de datos o la solicitud de una máquina para dichos datos. El desarrollo de microformatos ha sido una reacción a este tipo de críticas. Otro argumento en defensa de la viabilidad de la web semántica es la caída del precio probable de tareas de inteligencia humana en los mercados de trabajo digitales, tales como Amazon 's Mechanical Turk . [ cita requerida ]

Especificaciones como eRDF y RDFa permiten incrustar datos RDF arbitrarios en páginas HTML. El mecanismo GRDDL (Gleaning Resource Descriptions from Dialects of Language) permite que el material existente (incluidos los microformatos) se interprete automáticamente como RDF, por lo que los editores solo necesitan usar un formato único, como HTML.

Actividades de investigación sobre aplicaciones corporativas [ editar ]

El primer grupo de investigación que se centró explícitamente en la web semántica corporativa fue el equipo de ACACIA en INRIA-Sophia-Antipolis , fundado en 2002. Los resultados de su trabajo incluyen el motor de búsqueda Corese [39] basado en RDF (S) y la aplicación de la web semántica. tecnología en el ámbito de la inteligencia artificial distribuida para la gestión del conocimiento (por ejemplo, ontologías y sistemas multiagente para la Web semántica corporativa) [40] y e-learning . [41]

Desde 2008, el grupo de investigación de Web Semántica Corporativa, ubicado en la Universidad Libre de Berlín , se enfoca en bloques de construcción: Búsqueda Semántica Corporativa, Colaboración Semántica Corporativa e Ingeniería de Ontología Corporativa. [42]

La investigación en ingeniería de ontologías incluye la cuestión de cómo involucrar a los usuarios no expertos en la creación de ontologías y contenido anotado semánticamente [43] y para extraer conocimiento explícito de la interacción de los usuarios dentro de las empresas.

Futuro de las aplicaciones [ editar ]

Tim O'Reilly , quien acuñó el término Web 2.0, propuso una visión a largo plazo de la Web Semántica como una red de datos, donde aplicaciones sofisticadas manipulan la red de datos. [44] La red de datos transforma la World Wide Web de un sistema de archivos distribuido a un sistema de base de datos distribuido. [45]

Ver también [ editar ]

  • AGRIS
  • Gestión de semántica empresarial
  • Semántica computacional
  • Calais (producto de Reuters)
  • DBpedia
  • Modelo entidad-atributo-valor
  • Portal de datos abiertos de la UE
  • Hiperdatos
  • Internet de las Cosas
  • Datos vinculados
  • Lista de tecnologías emergentes
  • Nextbio
  • Alineación de ontología
  • Aprendizaje de ontología
  • RDF y OWL
  • Computación semántica
  • Web semántica geoespacial
  • Heterogeneidad semántica
  • Integración semántica
  • Coincidencia semántica
  • Semántica MediaWiki
  • Web de sensores semánticos
  • Red social semántica
  • Tecnología semántica
  • Web semántica
  • Comunidades en línea interconectadas semánticamente
  • Smart-M3
  • Web semántica social
  • Ingeniería web
  • Recurso web
  • Ciencia web

Referencias [ editar ]

  1. ^ "Cronología de estándares XML y Web semántica W3C" (PDF) . 2012-02-04.
  2. ^ "Consorcio World Wide Web (W3C)," Especificación de sintaxis RDF / XML (revisada) ", 10 de febrero de 2004" .
  3. ^ "Consorcio World Wide Web (W3C)," Descripción general del lenguaje de ontología web OWL ", Recomendación W3C, 10 de febrero de 2004" .
  4. ^ Chung, Seung-Hwa (2018). "El enfoque de MOUSE: mapeo de ontologías usando UML para ingenieros de sistemas" . Revista de revisiones por computadora : 8-29. ISSN 2581-6640 . 
  5. ^ a b "Actividad de la Web Semántica del W3C" . Consorcio World Wide Web (W3C). 7 de noviembre de 2011 . Consultado el 26 de noviembre de 2011 .
  6. ^ "Preguntas y respuestas con Tim Berners-Lee, Informe especial" . businessweek.com . Consultado el 14 de abril de 2018 .
  7. ↑ a b Berners-Lee, Tim; James Hendler; Ora Lassila (17 de mayo de 2001). "La Web Semántica" . Scientific American . Consultado el 2 de julio de 2019 .
  8. ^ Lee Feigenbaum (1 de mayo de 2007). "La Web Semántica en Acción" . Scientific American . Consultado el 24 de febrero de 2010 .
  9. ^ Berners-Lee, Tim ; Fischetti, Mark (1999). Tejiendo la Web . HarperSanFrancisco . capítulo 12 . ISBN 978-0-06-251587-2.
  10. ^ Berners-Lee, Tim (17 de mayo de 2001). "La Web Semántica" (PDF) . Scientific American . S2CID 32015696 . Consultado el 13 de marzo de 2008 .  
  11. ^ Nigel Shadbolt; Wendy Hall; Tim Berners-Lee (2006). "La Web Semántica Revisada" (PDF) . Sistemas inteligentes IEEE . Consultado el 13 de abril de 2007 .
  12. ^ Ramanathan V. Guha (2013). "Luz al final del túnel" . Conferencia Internacional de Web Semántica 2013 Keynote . Consultado el 8 de marzo de 2015 .
  13. ^ Allsopp, John (marzo de 2007). Microformatos: potenciando su marcado para Web 2.0 . Amigos de ED . pag. 368 . ISBN 978-1-59059-814-6.
  14. ^ Artem Chebotko y Shiyong Lu, "Consultar la Web semántica: un enfoque eficiente utilizando bases de datos relacionales", LAP Lambert Academic Publishing , ISBN 978-3-8383-0264-5 , 2009. 
  15. ^ Shannon, Victoria (23 de mayo de 2006). "Una Web 'más revolucionaria'" . International Herald Tribune . Consultado el 26 de junio de 2006 .
  16. ^ Sharma, Akhilesh. "Presentación del concepto de Web 3.0" . Retoque y truco . Consultado el 10 de enero de 2017 .
  17. ^ Hodgson, Matthew (9 de octubre de 2016). "Una web descentralizada devolvería el poder a las personas en línea" . TechCrunch . AOL Inc . Consultado el 1 de diciembre de 2016 .
  18. ^ Harris, John (7 de enero de 2019). "Juntos podemos frustrar la captura de datos de la gran tecnología: así es como" . The Guardian . Londres, Reino Unido. ISSN 0261-3077 . Consultado el 7 de enero de 2019 . 
  19. ^ Brooker, Katrina (29 de septiembre de 2018). "Exclusivo: Tim Berners-Lee nos cuenta su nuevo plan radical para poner patas arriba la World Wide Web" . Empresa rápida . USA . Consultado el 7 de enero de 2019 .
  20. ^ "Inicio | inrupt" . Inrupt . Consultado el 7 de enero de 2019 .
  21. ^ "Razonamiento de incertidumbre para la World Wide Web" . W3.org . Consultado el 20 de diciembre de 2018 .
  22. ^ Lukasiewicz, Thomas; Umberto Straccia (2008). "Gestión de la incertidumbre y la vaguedad en las lógicas descriptivas para la Web Semántica" (PDF) . Semántica web: ciencia, servicios y agentes en la World Wide Web . 6 (4): 291-308. doi : 10.1016 / j.websem.2008.04.001 .
  23. ^ "Estándares de Web Semántica" . W3.org . Consultado el 14 de abril de 2018 .
  24. ^ "Descripción general del lenguaje OWL Web Ontology" . Consorcio World Wide Web (W3C). 10 de febrero de 2004 . Consultado el 26 de noviembre de 2011 .
  25. ^ "Marco de descripción de recursos (RDF)" . Consorcio World Wide Web .
  26. Allemang, Dean; Hendler, James; Gandon, Fabien (3 de agosto de 2020). Web semántica para el ontólogo que trabaja: modelado eficaz para datos enlazados, RDFS y OWL (tercera edición). [Nueva York, NY, EE. UU.]: ACM Books; 3ª edición. ISBN 978-1450376143.
  27. ^ "ConverterToRdf - W3C Wiki" . W3.org . Consultado el 20 de diciembre de 2018 .
  28. ^ Sikos, Leslie F. (2015). Dominar los datos estructurados en la web semántica: de los microdatos HTML5 a los datos abiertos enlazados . Presione. pag. 23. ISBN 978-1-4842-1049-9.
  29. ^ Omar Alonso y Hugo Zaragoza. 2008. Explotación de anotaciones semánticas en la recuperación de información: ESAIR '08. Foro SIGIR 42, 1 (junio de 2008), 55–58. doi : 10.1145 / 1394251.1394262
  30. ^ Jaap Kamps, Jussi Karlgren y Ralf Schenkel. 2011. Informe del tercer taller sobre explotación de anotaciones semánticas en la recuperación de información (ESAIR). Foro SIGIR 45, 1 (mayo de 2011), 33–41. doi : 10.1145 / 1988852.1988858
  31. ^ Jaap Kamps, Jussi Karlgren , Peter Mika y Vanessa Murdock. 2012. Quinto taller sobre el aprovechamiento de las anotaciones semánticas en la recuperación de información: ESAIR '12). En Actas de la 21ª conferencia internacional ACM sobre gestión de la información y el conocimiento (CIKM '12). ACM, Nueva York, NY, EE. UU., 2772–2773. doi : 10.1145 / 2396761.2398761
  32. ^ Omar Alonso, Jaap Kamps y Jussi Karlgren . 2015. Informe del Séptimo Taller sobre Explotación de Anotaciones Semánticas en la Recuperación de Información (ESAIR '14). Foro SIGIR 49, 1 (junio de 2015), 27–34. doi : 10.1145 / 2795403.2795412
  33. ^ Kuriakose, John (septiembre de 2009). "Comprensión y adopción de la tecnología web semántica" . Cutter IT Journal . CORP. DE INFORMACIÓN DEL CORTADOR 22 (9): 10–18.
  34. ↑ a b c Marshall, Catherine C .; Shipman, Frank M. (2003). ¿Qué web semántica? (PDF) . Proc. Conf. ACM sobre hipertexto e hipermedia. págs. 57–66.
  35. ↑ a b Ivan Herman (2007). Estado de la Web Semántica (PDF) . Días Semánticos 2007 . Consultado el 26 de julio de 2007 .
  36. ^ Gärdenfors, Peter (2004). Cómo hacer que la Web Semántica sea más semántica . Ontología formal en sistemas de información: actas de la tercera conferencia internacional (FOIS-2004) . IOS Press. págs. 17–34.
  37. ^ Honkela, Timo; Könönen, Ville; Lindh-Knuutila, Tiina; Paukkeri, Mari-Sanna (2008). "Simular procesos de formación y comunicación de conceptos". Revista de Metodología Económica . 15 (3): 245-259. doi : 10.1080 / 13501780802321350 .
  38. ^ "Proyecto Web consciente de políticas" . Policyawareweb.org . Consultado el 14 de junio de 2013 .
  39. ^ Corby, Olivier; Dieng-Kuntz, Rose; Zucker, Catherine Faron; Gandon, Fabien (NaN). "Buscando en la Web Semántica: Procesamiento Aproximado de Consultas basado en Ontologías" . Sistemas inteligentes IEEE . 21 : 20-27. doi : 10.1109 / MIS.2006.16 . S2CID 11488848 .  Verifique los valores de fecha en: |date=( ayuda )
  40. ^ Gandon, Fabien (7 de noviembre de 2002). "Inteligencia Artificial Distribuida y Gestión del Conocimiento: Ontologías y Sistemas Multi-Agentes para una Web Semántica Corporativa" . Université Nice Sophia Antipolis.
  41. ^ Buffa, Michel; Dehors, Sylvain; Faron-Zucker, Catherine; Sander, Peter (2005). "Hacia un enfoque de Web semántica corporativa en el diseño de sistemas de aprendizaje: revisión del proyecto Trial Solutioins" (PDF) . Taller Internacional de Aplicaciones de Tecnologías Web Semánticas para E-Learning . Amsterdam, Holanda. págs. 73–76.
  42. ^ "Web semántica corporativa - Inicio" . Corporate-semantic-web.de . Consultado el 14 de abril de 2018 .
  43. ^ Hinze, Annika; Heese, Ralf; Luczak-Rösch, Markus; Paschke, Adrian (2012). "Enriquecimiento semántico por no expertos: usabilidad de herramientas de anotación manual" (PDF) . ISWC'12 - Actas de la 11ª conferencia internacional sobre la Web Semántica . Boston, Estados Unidos. págs. 165-181.
  44. ^ Mathieson, SA (6 de abril de 2006). "Corre la voz y únete" . The Guardian . Consultado el 14 de abril de 2018 .
  45. ^ Spivack, Nova (18 de septiembre de 2007). "Web Semántica, Inteligencia Colectiva e Hiperdatos" . novaspivack.typepad.com/nova_spivacks_weblog [Este blog se ha trasladado a NovaSpivack.com] . Consultado el 14 de abril de 2018 .

Lectura adicional [ editar ]

  • Liyang Yu (14 de diciembre de 2014). Una guía para desarrolladores de la web semántica, 2ª ed . Saltador. ISBN 978-3-662-43796-4.
  • A Programmable Web de Aaron Swartz: una obra inacabada donada por Morgan & Claypool Publishers después de la muerte de Aaron Swartz en enero de 2013.
  • Grigoris Antoniou, Frank van Harmelen (31 de marzo de 2008). A Semantic Web Primer, 2ª edición . La prensa del MIT . ISBN 978-0-262-01242-3.
  • Allemang, decano; Hendler, James; Gandon, Fabien (3 de agosto de 2020). Web semántica para el ontólogo que trabaja: modelado eficaz para datos enlazados, RDFS y OWL (tercera edición). [Nueva York, NY, EE. UU.]: ACM Books; 3ª edición. ISBN 978-1450376143.
  • Pascal Hitzler ; Markus Krötzsch; Sebastian Rudolph (25 de agosto de 2009). Fundamentos de las tecnologías web semánticas . CRCPulse. ISBN 978-1-4200-9050-5.
  • Thomas B. Passin (1 de marzo de 2004). Guía del explorador de la web semántica . Publicaciones Manning. ISBN 978-1-932394-20-7.
  • Jeffrey T. Pollock (23 de marzo de 2009). Web semántica para principiantes . Para Dummies. ISBN 978-0-470-39679-7.

Enlaces externos [ editar ]

  • Página web oficial
  • Análisis revolucionario: un espacio de datos para la coexistencia de información