La integración semántica es el proceso de interrelacionar información de diversas fuentes, por ejemplo, calendarios y listas de tareas, archivos de correo electrónico, información de presencia (física, psicológica y social), documentos de todo tipo, contactos (incluidos gráficos sociales ), resultados de búsqueda y relevancia publicitaria y de marketing derivada de ellos. En este sentido, la semántica se centra en la organización y la acción de la información actuando como intermediaria entre fuentes de datos heterogéneas, que pueden entrar en conflicto no solo por la estructura, sino también por el contexto o el valor.
Aplicaciones y métodos
En la integración de aplicaciones empresariales (EAI), la integración semántica puede facilitar o incluso automatizar la comunicación entre sistemas informáticos mediante la publicación de metadatos . La publicación de metadatos ofrece potencialmente la posibilidad de vincular ontologías automáticamente . Un enfoque para el mapeo de ontologías (semi) automatizado requiere la definición de una distancia semántica o su similitud semántica inversa y reglas apropiadas. Otros enfoques incluyen los llamados métodos léxicos , así como metodologías que se basan en la explotación de las estructuras de las ontologías. Para establecer explícitamente similitud / igualdad, existen propiedades o relaciones especiales en la mayoría de los lenguajes de ontología. OWL , por ejemplo, tiene "búho: clase equivalente", "búho: propiedad equivalente" y "búho: igual que".
Eventualmente, los diseños de sistemas pueden ver el advenimiento de arquitecturas componibles donde las interfaces publicadas basadas en semánticas se unen para habilitar capacidades nuevas y significativas [ cita requerida ] . Estos podrían describirse predominantemente por medio de especificaciones declarativas en tiempo de diseño, que en última instancia podrían renderizarse y ejecutarse en tiempo de ejecución [ cita requerida ] .
La integración semántica también se puede utilizar para facilitar las actividades de diseño de interfaz y mapeo en tiempo de diseño. En este modelo, la semántica solo se aplica explícitamente al diseño y los sistemas de tiempo de ejecución funcionan a nivel de sintaxis [ cita requerida ] . Este enfoque de "vinculación semántica temprana" puede mejorar el rendimiento general del sistema al tiempo que conserva los beneficios del diseño impulsado por la semántica [ cita requerida ] .
Situaciones de integración semántica
A partir del caso de uso de la industria, se ha observado que las asignaciones semánticas se realizaron solo dentro del alcance de la clase de ontología o la propiedad del tipo de datos. Estas integraciones semánticas identificadas son (1) integración de instancias de clase de ontología en otra clase de ontología sin ninguna restricción, (2) integración de instancias seleccionadas en una clase de ontología en otra clase de ontología por la restricción de rango del valor de propiedad y (3) integración de instancias de clase de ontología en otra clase de ontología con la transformación de valor de la propiedad de instancia. Cada uno de ellos requiere una relación de mapeo particular, que es respectivamente: (1) relación de mapeo equivalente o de subsunción, (2) relación de mapeo condicional que restringe el valor de la propiedad (rango de datos) y (3) relación de mapeo de transformación que transforma el valor de propiedad (transformación de la unidad). Cada relación de mapeo identificada se puede definir como (1) tipo de mapeo directo, (2) tipo de mapeo de rango de datos o (3) tipo de mapeo de transformación de unidad.
Enfoques KG frente a RDB
En el caso de integrar una fuente de datos complementaria,
- KG ( gráfico de conocimiento ) representa formalmente el significado involucrado en la información al describir conceptos, relaciones entre cosas y categorías de cosas. Esta semántica incrustada con los datos ofrece ventajas significativas, como el razonamiento sobre los datos y el manejo de fuentes de datos heterogéneas. Las reglas se pueden aplicar en KG de manera más eficiente mediante la consulta de gráficos. Por ejemplo, la consulta del gráfico hace la inferencia de datos a través de las relaciones conectadas, en lugar de la búsqueda completa repetida de las tablas en la base de datos relacional. KG facilita la integración de nuevos datos heterogéneos simplemente agregando nuevas relaciones entre la información existente y las nuevas entidades. Esta facilitación se enfatiza para la integración con fuentes de datos abiertos vinculados populares existentes, como Wikidata.org.
- La consulta SQL está estrechamente acoplada y rígidamente restringida por el tipo de datos dentro de la base de datos específica y puede unir tablas y extraer datos de tablas, y el resultado es generalmente una tabla, y una consulta puede unir tablas por cualquier columna que coincida con el tipo de datos. La consulta SPARQL es el lenguaje y protocolo de consulta estándar para datos abiertos vinculados en la web y está vagamente acoplado con la base de datos para que facilite la reutilización y pueda extraer datos a través de las relaciones libres del tipo de datos, y no solo extraer sino también generar un gráfico de conocimiento adicional. con operaciones más sofisticadas (lógica: transitiva / simétrica / inverseOf / funcional). La consulta basada en inferencias (consulta sobre los hechos afirmados existentes sin la generación de nuevos hechos por la lógica) puede compararse rápidamente con la consulta basada en el razonamiento (consulta sobre los hechos existentes más los hechos generados / descubiertos basados en la lógica).
- La integración de información de fuentes de datos heterogéneas en la base de datos tradicional es compleja, lo que requiere el rediseño de la tabla de la base de datos, como cambiar la estructura y / o agregar nuevos datos. En el caso de la consulta semántica, la consulta SPARQL refleja las relaciones entre entidades de una manera que se alinea con la comprensión humana del dominio, por lo que la intención semántica de la consulta se puede ver en la consulta misma. A diferencia de SPARQL, la consulta SQL, que refleja la estructura específica de la base de datos y deriva de la coincidencia de las claves primarias y externas relevantes de las tablas, pierde la semántica de la consulta al perder las relaciones entre las entidades. A continuación se muestra el ejemplo que compara consultas SPARQL y SQL para medicamentos que tratan la "TB de vértebra".
SELECCIONE? Medicación
DONDE {
? Diagnóstico un ejemplo: Diagnóstico.
? ejemplo de diagnóstico: nombre “TB de vértebra”.
Ejemplo de medicación: diagnóstico canTreat.
}
SELECCIONE DRUG.medID
DE DIAGNOSIS, DRUG, DRUG_DIAGNOSIS
DONDE DIAGNOSIS.diagnosisID = DRUG_DIAGNOSIS.diagnosisID
Y DRUG.medID = DRUG_DIAGNOSIS.medID
AND DIAGNOSIS.name = "TB de vértebra"
Ejemplos de
El Pacific Symposium on Biocomputing ha sido un lugar para la popularización de la tarea de mapeo de ontologías en el dominio biomédico, y una serie de artículos sobre el tema se pueden encontrar en sus actas.