El intercambio de datos


El intercambio de datos es el proceso de tomar datos estructurados bajo un esquema de origen y transformarlos en un esquema de destino , de modo que los datos de destino sean una representación precisa de los datos de origen. [1] El intercambio de datos permite compartir datos entre diferentes programas informáticos.

Es similar al concepto relacionado de integración de datos, excepto que los datos en realidad se reestructuran (con posible pérdida de contenido) en el intercambio de datos. Puede que no haya forma de transformar una instancia dadas todas las restricciones. Por el contrario, puede haber numerosas formas de transformar la instancia (posiblemente infinitas), en cuyo caso se debe identificar y justificar una "mejor" opción de solución.

En algunos dominios, pueden existir unas pocas docenas de esquemas de origen y de destino diferentes (formatos de datos patentados). Un "intercambio" o "formato de intercambio" a menudo se desarrolla para un solo dominio, y luego se escriben las rutinas necesarias (asignaciones) para (indirectamente) transformar/traducir todos y cada uno de los esquemas de origen a todos y cada uno de los esquemas de destino utilizando el formato de intercambio como un paso intermedio. [2] Eso requiere mucho menos trabajo que escribir y depurar los cientos de rutinas diferentes que serían necesarias para traducir directamente todos y cada uno de los esquemas de origen directamente a todos y cada uno de los esquemas de destino.

Un lenguaje/formato de intercambio (o intercambio) de datos es un lenguaje que es independiente del dominio y puede usarse para datos de cualquier tipo de disciplina. [9] Han "evolucionado de estar orientados al marcado y la visualización para respaldar aún más la codificación de metadatos que describen los atributos estructurales de la información". [10]

La práctica ha demostrado que ciertos tipos de lenguajes formales son más adecuados para esta tarea que otros, ya que su especificación está impulsada por un proceso formal en lugar de necesidades particulares de implementación de software. Por ejemplo, XML es un lenguaje de marcado que se diseñó para permitir la creación de dialectos (la definición de sublenguajes específicos del dominio). [11] Sin embargo, no contiene diccionarios específicos de dominio o tipos de hechos. Beneficioso para un intercambio de datos confiable es la disponibilidad de taxonomías estándar y bibliotecas de herramientas, como analizadores , validadores de esquemas y herramientas de transformación. [ cita requerida ]

La siguiente es una lista parcial de lenguajes genéricos populares utilizados para el intercambio de datos en múltiples dominios.