La exploración de datos (también desglose ) se refiere a cualquiera de las diversas operaciones y transformaciones en datos tabulares, relacionales y multidimensionales. El término tiene un uso generalizado en varios contextos, pero se asocia principalmente con software especializado diseñado específicamente para el análisis de datos .
Operaciones comunes de perforación de datos
Hay ciertas operaciones que son comunes a las aplicaciones que permiten la exploración de datos. Entre ellos están:
Operaciones de consulta :
- consulta tabular
- consulta dinámica
Consulta tabular
Las operaciones de consulta tabular consisten en operaciones estándar en tablas de datos.
Entre estas operaciones se encuentran:
- buscar
- clasificar
- filtro (por valor)
- filtro (por función o condición extendida)
- transformar (por ejemplo, agregando o quitando columnas)
Considere el siguiente ejemplo:
Mesa Fred y Wilma (Fig 001) :
género, fname, lname, hogar macho, fred, chopin, Polonia masculino, fred, picapiedra, lecho de roca männlich, fred durst, estados unidos femenino, wilma, picapiedra, lecho de roca hembra, wilma, rudolph, estados unidos hembra, wilma, webb, estados unidos masculino, fred johnson, estados unidos
Lo anterior es un ejemplo de una tabla de archivos planos simple formateada como valores separados por comas. La tabla incluye el nombre, apellido, sexo y país de origen de varias personas llamadas fred o wilma. Aunque el ejemplo está formateado de esta manera, es importante enfatizar que las operaciones de consulta tabular (así como todas las operaciones de exploración de datos) se pueden aplicar a cualquier tipo de datos concebible , independientemente del formato subyacente. El único requisito es que la aplicación de software en uso pueda leer los datos.
Consulta dinámica
Una consulta dinámica permite múltiples representaciones de datos según diferentes dimensiones. Este tipo de consulta es similar a la consulta tabular, excepto que también permite que los datos se representen en formato de resumen, de acuerdo con una jerarquía flexible seleccionada por el usuario . Esta clase de operación de exploración de datos se conoce formalmente (y libremente) por diferentes nombres, incluida la consulta de tabla cruzada , la tabla dinámica , el piloto de datos , la jerarquía selectiva , la intertwingularidad y otros.
Para ilustrar los conceptos básicos de las operaciones de consulta dinámica, considere la tabla de Fred y Wilma (Fig. 001) . Un escaneo rápido de los datos revela que la tabla tiene información redundante. Esta redundancia podría consolidarse mediante un esquema o una estructura de árbol o de alguna otra manera. Además, una vez consolidados, los datos podrían tener muchos diseños alternativos diferentes.
Usando un esquema de texto simple como salida, los siguientes diseños alternativos son posibles con una consulta dinámica:
Resuma por género (Fig 001) :
mujer Picapiedra, Wilma Rudolph, Wilma webb, wilma masculino chopin, fred picapiedra, fred durst, fred johnson, fred (Dimensiones = género; Campos tabulares = lname, fname;)
Resumir por hogar, lname (Fig 001) :
base Picapiedra Fred wilma Polonia chopin Fred EE.UU ... (Dimensiones = casa, lname; Campos tabulares = fname;)
Usos
Las operaciones de consulta dinámica son útiles para resumir un corpus de datos de múltiples formas, ilustrando así diferentes representaciones de la misma información básica. Aunque este tipo de operación aparece de manera prominente en las hojas de cálculo y el software de base de datos de escritorio , se puede decir que su flexibilidad está infrautilizada. Hay muchas aplicaciones que solo permiten una jerarquía 'fija' para representar datos, y esto representa una limitación sustancial.
Drillup
Drillup es lo opuesto al drilldown. Por ejemplo, si desglosa para ver los ingresos de un producto, es posible que desee desglosar para ver los ingresos de todos los productos. [1]
Referencias
- ^ "Perforar y perforar" . IBM . Consultado el 5 de mayo de 2020 .