La integración de información empresarial ( EII ) es la capacidad de admitir una vista unificada de datos e información para toda una organización. En una aplicación de virtualización de datos de EII, un proceso de integración de información , que utiliza la abstracción de datos para proporcionar una interfaz unificada (conocida como acceso uniforme a los datos ) para ver todos los datos dentro de una organización, y un solo conjunto de estructuras y convenciones de nomenclatura (conocidas como representación uniforme de la información ) para representar estos datos; El objetivo de EII es lograr que un gran conjunto de fuentes de datos heterogéneas le parezcan a un usuario o sistema como una única fuente de datos homogénea.
Descripción general
Los datos dentro de una empresa se pueden almacenar en formatos heterogéneos, incluidas bases de datos relacionales (que a su vez vienen en una gran cantidad de variedades), archivos de texto, archivos XML , hojas de cálculo y una variedad de métodos de almacenamiento patentados , cada uno con sus propios métodos de indexación y acceso a datos. .
Han surgido API de acceso a datos estandarizadas que ofrecen un conjunto específico de comandos para recuperar y modificar datos de una fuente de datos genérica. Existen muchas aplicaciones que implementan los comandos de estas API en varias fuentes de datos, sobre todo bases de datos relacionales. Dichas API incluyen ODBC , JDBC , XQJ , OLE DB y, más recientemente, ADO.NET .
También existen formatos estándar para representar datos dentro de un archivo que son muy importantes para la integración de información. El más conocido de ellos es XML, que se ha convertido en un formato de representación universal estándar. También hay "gramáticas" XML más específicas definidas para tipos específicos de datos, como el lenguaje de marcado de geografía para expresar características geográficas y el lenguaje de marcado de servicio de directorio para almacenar información de estilo de directorio. Además, existen formatos estándar que no son XML, como iCalendar para representar la información del calendario y vCard para la información de la tarjeta de presentación .
Enterprise Information Integration (EII) aplica la integración de datos comercialmente. A pesar de los problemas teóricos descritos anteriormente, el sector privado muestra más preocupación por los problemas de integración de datos como producto viable. [1] EII no enfatiza ni la corrección ni la manejabilidad, sino la velocidad y la simplicidad. Los profesionales citan los siguientes problemas importantes que EII debe abordar para que la industria madure: [ cita requerida ]
- Combinando conjuntos de datos dispares
- Cada fuente de datos es dispar y, como tal, no está diseñada para admitir EII. Por lo tanto, la virtualización de datos y la federación de datos dependen de los datos comunes accidentales para admitir la combinación de datos e información de conjuntos de datos dispares. Debido a esta falta de valor común de los datos entre las fuentes de datos, el conjunto de retorno puede ser inexacto, incompleto e imposible de validar.
- Una solución es refundir bases de datos dispares para integrar estas bases de datos sin necesidad de ETL . Las bases de datos refundidas admiten restricciones de similitud en las que se puede hacer cumplir la integridad referencial entre bases de datos. Las bases de datos refundidas proporcionan rutas de acceso a datos diseñadas con valor común de datos en todas las bases de datos.
- Sencillez de comprensión
- Responder consultas con vistas despierta interés desde un punto de vista teórico, pero dificultades para entender cómo incorporarlo como una "solución empresarial". [ cita requerida ]
- Sencillez de implementación
- Incluso si se reconoce como una solución a un problema, EII a partir de 2009 [actualizar]actualmente lleva tiempo aplicar y ofrece complejidades en la implementación. Las soluciones propuestas sin esquema incluyen "Lean Middleware", [2] pero la facilidad de uso y la velocidad de empleo parecen inversamente proporcionales a la generalidad de tales sistemas. [ cita requerida ]
- Manejo de información de orden superior
- Los analistas experimentan dificultades, incluso con un sistema de integración de información en funcionamiento, para determinar si las fuentes de la base de datos satisfacen una aplicación determinada. Responder a este tipo de preguntas sobre un conjunto de repositorios requiere información semántica como metadatos y / u ontologías.
Aplicaciones
Los productos EII permiten un acoplamiento flexible entre aplicaciones y servicios cliente que consumen datos homogéneos y almacenes de datos heterogéneos. Tales aplicaciones y servicios cliente incluyen herramientas de productividad de escritorio (hojas de cálculo, procesadores de texto , software de presentación, etc.), entornos y marcos de desarrollo ( Java EE , .NET , Mono , SOAP o servicios web RESTful , etc.), inteligencia empresarial (BI). , software de monitoreo de actividad empresarial (BAM), planificación de recursos empresariales (ERP), gestión de relaciones con el cliente (CRM), software de gestión de procesos empresariales (BPM y / o BPEL) y gestión de contenido web (CMS).
Tecnologías de acceso a datos
- Objetos de datos de servicio (SDO) para clientes Java, C ++ y .Net y cualquier tipo de fuente de datos
- API de XQuery y XQuery para Java
Ver también
- Inteligencia empresarial 2.0 (BI 2.0)
- Almacén de datos
- Sistema desigual
- Integración empresarial
- Sistema de base de datos federada
- Marco de descripción de recursos
- Heterogeneidad semántica
- Integración semántica
- Web semántica
- web 2.0
- servicios web
Referencias
- ^ Alon Y. Halevy; et al. (2005). "Integración de la información empresarial: éxitos, desafíos y controversias" (PDF) . SIGMOD 2005 . págs. 778–787. doi : 10.1145 / 1066157.1066246 .
- ^ David A. Maluf; et al. (2005). "Middleware ajustado". SIGMOD 2005 . págs. 788–791. doi : 10.1145 / 1066157.1066247 .