Dimensión (almacén de datos)


Una dimensión es una estructura que categoriza hechos y medidas para permitir a los usuarios responder preguntas comerciales. Las dimensiones comúnmente utilizadas son personas, productos, lugar y tiempo. [1] [2] (Nota: las personas y el tiempo a veces no se modelan como dimensiones).

En un almacén de datos , las dimensiones proporcionan información de etiquetado estructurada a medidas numéricas que de otro modo no estarían ordenadas. La dimensión es un conjunto de datos compuesto por elementos de datos individuales que no se superponen . Las funciones principales de las dimensiones son tres: proporcionar filtrado, agrupación y etiquetado.

Estas funciones a menudo se describen como " rebanar y dados ". Un ejemplo común de almacén de datos implica las ventas como medida, con el cliente y el producto como dimensiones. En cada venta un cliente compra un producto. Los datos se pueden segmentar eliminando todos los clientes, excepto un grupo en estudio, y luego dividirlos en cubos mediante la agrupación por producto.

Normalmente, las dimensiones de un almacén de datos se organizan internamente en una o más jerarquías. "Fecha" es una dimensión común, con varias jerarquías posibles:

Una dimensión que cambia lentamente es un conjunto de atributos de datos que cambian lentamente durante un período de tiempo en lugar de cambiar regularmente, por ejemplo, la dirección o el nombre. Estos atributos pueden cambiar durante un período de tiempo y se combinarán como una dimensión que cambia lentamente. Estas dimensiones se pueden clasificar en tipos: [3]

Una dimensión conformada es un conjunto de atributos de datos a los que se ha hecho referencia físicamente en varias tablas de bases de datos utilizando el mismo valor clave para hacer referencia a la misma estructura, atributos, valores de dominio, definiciones y conceptos. Una dimensión conformada atraviesa muchos hechos.


Una tabla de dimensiones en un cubo OLAP con un esquema en estrella