Integración de la información


La integración de información ( II ) es la fusión de información de fuentes heterogéneas con diferentes representaciones conceptuales, contextuales y tipográficas. Se utiliza en minería de datos y consolidación de datos de recursos no estructurados o semiestructurados. Por lo general, la integración de la información se refiere a las representaciones textuales del conocimiento, pero a veces se aplica al contenido de medios enriquecidos . La fusión de información , que es un término relacionado, implica la combinación de información en un nuevo conjunto de información para reducir la redundancia y la incertidumbre. [1]

Los ejemplos de tecnologías disponibles para integrar la información incluyen la deduplicación y las métricas de cadenas que permiten la detección de texto similar en diferentes fuentes de datos mediante coincidencias aproximadas . Hay disponible una gran cantidad de métodos para estas áreas de investigación, como los presentados en la Sociedad Internacional de Fusión de la Información. Otros métodos se basan en estimaciones causales de los resultados basadas en un modelo de las fuentes. [2]