La integración de datos basada en ontologías implica el uso de una o más ontologías para combinar de manera efectiva datos o información de múltiples fuentes heterogéneas. [1] Es uno de los múltiples enfoques de integración de datos y puede clasificarse como Global-As-View (GAV). [2] La eficacia de la integración de datos basada en ontologías está estrechamente ligada a la coherencia y expresividad de la ontología utilizada en el proceso de integración.
Fondo
Los datos de múltiples fuentes se caracterizan por múltiples tipos de heterogeneidad. A menudo se utiliza la siguiente jerarquía: [3] [4] [5]
- Heterogeneidad sintáctica : es el resultado de diferencias en el formato de representación de los datos.
- Heterogeneidad esquemática o estructural : el modelo o la estructura nativa para almacenar datos difieren en las fuentes de datos, lo que genera heterogeneidad estructural. La heterogeneidad esquemática que aparece particularmente en las bases de datos estructuradas también es un aspecto de la heterogeneidad estructural. [3]
- Heterogeneidad semántica : las diferencias en la interpretación del 'significado' de los datos son fuente de heterogeneidad semántica
- Heterogeneidad del sistema : el uso de diferentes sistemas operativos , las plataformas de hardware conducen a la heterogeneidad del sistema.
Las ontologías , como modelos formales de representación con conceptos explícitamente definidos y relaciones nombradas que los vinculan, se utilizan para abordar el problema de la heterogeneidad semántica en las fuentes de datos. En dominios como la bioinformática y la biomedicina , el rápido desarrollo, adopción y disponibilidad pública de ontologías [1] ha hecho posible que la comunidad de integración de datos las aproveche para la integración semántica de datos e información.
El papel de las ontologías
Las ontologías permiten la identificación inequívoca de entidades en sistemas de información heterogéneos y la afirmación de relaciones nombradas aplicables que conectan estas entidades entre sí. Específicamente, las ontologías desempeñan los siguientes roles:
- Explicación de contenido
- [1] La ontología permite la interpretación precisa de datos de múltiples fuentes a través de la definición explícita de términos y relaciones en la ontología.
- Modelo de consulta
- [1] En algunos sistemas como SIMS, [6] la consulta se formula utilizando la ontología como un esquema de consulta global.
- Verificación
- [1] La ontología verifica las asignaciones utilizadas para integrar datos de múltiples fuentes. Estas asignaciones pueden ser especificadas por el usuario o generadas por un sistema.
Enfoques que utilizan ontologías para la integración de datos
Hay tres arquitecturas principales que se implementan en aplicaciones de integración de datos basadas en ontologías, [1] a saber,
- Enfoque de ontología única
- Se utiliza una única ontología como modelo de referencia global en el sistema. Este es el enfoque más simple, ya que puede ser simulado por otros enfoques. [1] SIMS [6] un ejemplo destacado de este enfoque. El componente de integración estructurada de fuentes de conocimiento de Research Cyc es otro ejemplo destacado de este enfoque. [7] [8] (Título = Aprovechar el ciclo para responder a las consultas ad hoc de los investigadores clínicos). El Gellish Taxonomic Dictionary-Ontology también sigue este enfoque. [9]
- Múltiples ontologías
- Se utilizan múltiples ontologías, cada una de las cuales modela una fuente de datos individual, en combinación para la integración. Aunque este enfoque es más flexible que el enfoque de ontología única, requiere la creación de asignaciones entre las múltiples ontologías. El mapeo de ontologías es un tema desafiante y es el foco de un gran número de esfuerzos de investigación en informática [2] . El sistema OBSERVER [10] es un ejemplo de este enfoque.
- Enfoques híbridos
- El enfoque híbrido implica el uso de múltiples ontologías que se suscriben a un vocabulario común de alto nivel. [11] El vocabulario de nivel superior define los términos básicos del dominio. Por lo tanto, el enfoque híbrido facilita el uso de múltiples ontologías para la integración en presencia del vocabulario común.
Ver también
Referencias
- ^ a b c d e f H. Wache; T. Vögele; U. Visser; H. Stuckenschmidt; G. Schuster; H. Neumann; S. Hübner (2001). Integración de información basada en ontologías Una encuesta de enfoques existentes . CiteSeerX 10.1.1.142.4390 .
- ^ Maurizio Lenzerini (2002). Integración de datos: una perspectiva teórica (PDF) . págs. 243–246.
- ^ a b AP Sheth (1999). Cambio de enfoque en la interoperabilidad en los sistemas de información: del sistema, la sintaxis, la estructura a la semántica (PDF) . págs. 5-30. Parámetro desconocido
|book-title=
ignorado ( ayuda ) - ^ Tutorial 5 de AHM02: Integración y mediación de datos; Colaboradores: B. Ludaescher, I. Altintas, A. Gupta, M. Martone, R. Marciano, X. Qian
- ^ "Tutorial 5 de AHM02: Integración y Mediación de Datos" . users.sdsc.edu . Consultado el 23 de noviembre de 2017 .
- ^ a b Y. Arens; C. Hsu; CA Knoblock (1996). Procesamiento de consultas en sims mediador de información (PDF) .
- ^ http://www.cyc.com/content/semantic-knowledge-source-integration
- ^ "Copia archivada" . Archivado desde el original el 31 de diciembre de 2010 . Consultado el 15 de mayo de 2014 .CS1 maint: copia archivada como título ( enlace )
- ^ https://www.gellish.net
- ^ E. Mena; V. Kashyap; A. Sheth; A. Illarramendi (1996). OBSERVER: Un enfoque para el procesamiento de consultas en sistemas de información globales basado en la interoperación entre ontologías preexistentes (PDF) .
- ^ Cheng Hian Goh (1997). Representación y razonamiento de conflictos semánticos en sistemas de información heterogéneos (PDF) .
enlaces externos
- Página de inicio de OBSERVER
- Cyc Semantic Knowledge Source Integration (SKSI)