De Wikipedia, la enciclopedia libre
Saltar a navegación Saltar a búsqueda
El esquema de copo de nieve es una variación del esquema de estrella, que presenta la normalización de tablas de dimensiones.

En informática , un esquema de copo de nieve es una disposición lógica de tablas en una base de datos multidimensional de manera que el diagrama de relación de entidades se asemeja a la forma de un copo de nieve . El esquema del copo de nieve está representado por tablas de hechos centralizadas que están conectadas a múltiples dimensiones . [ cita requerida ] . "Snowflaking" es un método para normalizar las tablas de dimensiones en un esquema en estrella . Cuando está completamente normalizado a lo largo de todas las tablas de dimensiones, la estructura resultante se asemeja a un copo de nieve con la tabla de hechos.en el medio. El principio detrás del copo de nieve es la normalización de las tablas de dimensiones eliminando los atributos de cardinalidad baja y formando tablas separadas. [1]

El esquema de copo de nieve es similar al esquema de estrella. Sin embargo, en el esquema de copo de nieve, las dimensiones se normalizan en varias tablas relacionadas, mientras que las dimensiones del esquema en estrella se desnormalizan con cada dimensión representada por una única tabla. Una forma compleja de copo de nieve surge cuando las dimensiones de un esquema de copo de nieve son elaboradas, tienen múltiples niveles de relaciones, y las tablas secundarias tienen múltiples tablas principales ("bifurcaciones en el camino").

Usos comunes [ editar ]

Los esquemas de estrella y copo de nieve se encuentran más comúnmente en almacenes de datos dimensionales y mercados de datos donde la velocidad de recuperación de datos es más importante que la eficiencia de la manipulación de datos. Como tal, las tablas de estos esquemas no están muy normalizadas y, con frecuencia, se diseñan a un nivel de normalización por debajo de la tercera forma normal . [2]

Normalización y almacenamiento de datos [ editar ]

La normalización divide los datos para evitar la redundancia (duplicación) al mover grupos de datos que se repiten habitualmente a nuevas tablas. Por lo tanto, la normalización tiende a aumentar la cantidad de tablas que se deben unir para realizar una consulta determinada, pero reduce el espacio requerido para contener los datos y el número de lugares donde debe actualizarse si los datos cambian.

Desde el punto de vista del almacenamiento de espacio, las tablas dimensionales suelen ser pequeñas en comparación con las tablas de hechos. Esto a menudo niega los beneficios potenciales de espacio de almacenamiento del esquema de estrella en comparación con el esquema de copo de nieve. Ejemplo: Un millón de transacciones de ventas en 300 tiendas en 220 países daría como resultado 1,000,300 registros en un esquema de estrella (1,000,000 registros en la tabla de hechos y 300 registros en la tabla dimensional donde cada país se enumeraría explícitamente para cada tienda en ese país). Un esquema de copo de nieve más normalizado con claves de países que se refieren a una tabla de países consistiría en la misma tabla de hechos de 1.000.000 de registros, una tabla de 300 tiendas de discos con referencias a una tabla de países con 220 registros. En este caso, el esquema en estrella, aunque desnormalizado aún más, solo reduciría el número de registros en un factor (insignificante) de ~ 0.9998 (= [1,000,000 + 300] dividido por [1,000,000 + 300 + 220])

Algunos desarrolladores de bases de datos se comprometen al crear un esquema de copo de nieve subyacente con vistas construidas sobre él que realizan muchas de las uniones necesarias para simular un esquema en estrella. Esto proporciona los beneficios de almacenamiento logrados mediante la normalización de dimensiones con la facilidad de consulta que proporciona el esquema en estrella. La desventaja es que requerir que el servidor realice las uniones subyacentes automáticamente puede resultar en un impacto en el rendimiento al realizar consultas, así como en uniones adicionales a las tablas que pueden no ser necesarias para cumplir con ciertas consultas. [ cita requerida ]

Beneficios [ editar ]

El esquema del copo de nieve pertenece a la misma familia que el modelo lógico del esquema en estrella . De hecho, el esquema de estrella se considera un caso especial del esquema de copo de nieve. El esquema de copo de nieve proporciona algunas ventajas sobre el esquema de estrella en determinadas situaciones, que incluyen:

  • Algunas herramientas de modelado de bases de datos multidimensionales OLAP están optimizadas para esquemas de copos de nieve. [3]
  • La normalización de atributos da como resultado ahorros de almacenamiento, y la compensación es una complejidad adicional en las uniones de consultas de origen.

Desventajas [ editar ]

La principal desventaja del esquema de copo de nieve es que los niveles adicionales de normalización de atributos agregan complejidad a las uniones de consultas de origen, en comparación con el esquema en estrella .

Los esquemas de copos de nieve, en contraste con las dimensiones planas de una sola mesa, han sido fuertemente criticados. Se supone que su objetivo es un almacenamiento eficiente y compacto de datos normalizados, pero esto tiene el costo significativo de un rendimiento deficiente al examinar las uniones requeridas en esta dimensión. [4] Esta desventaja puede haberse reducido en los años desde que se reconoció por primera vez, debido a un mejor rendimiento de las consultas dentro de las herramientas de navegación.

Cuando se compara con un esquema transaccional altamente normalizado , la desnormalización del esquema de copo de nieve elimina las garantías de integridad de los datos proporcionadas por los esquemas normalizados. [ cita requerida ] Las cargas de datos en el esquema del copo de nieve deben estar altamente controladas y administradas para evitar actualizaciones e insertar anomalías.

Ejemplos [ editar ]

Esquema de copo de nieve utilizado por la consulta de ejemplo.

El esquema de ejemplo que se muestra a la derecha es una versión en copos de nieve del ejemplo de esquema en estrella proporcionado en el artículo del esquema en estrella .

La siguiente consulta de ejemplo es el esquema de copo de nieve equivalente al código de ejemplo de esquema de estrella que devuelve el número total de unidades de televisión vendidas por marca y por país para 1997. Observe que la consulta de esquema de copo de nieve requiere muchas más combinaciones que la versión de esquema de estrella para cumplir incluso una simple consulta. La ventaja de utilizar el esquema de copo de nieve en este ejemplo es que los requisitos de almacenamiento son menores, ya que el esquema de copo de nieve elimina muchos valores duplicados de las propias dimensiones.

SELECT B . Marca , G . País , SUM ( F . Units_Sold ) DE  Fact_Sales  F INTERIOR  ÚNETE  Dim_Date  D  EN  F . Date_id  =  D . Id INNER  JOIN  Dim_Store  S  EN  F . STORE_ID  =  S . Id INNER  JOIN  Dim_Geography  G  EN  S . Geography_Id  =  G .Id INNER  JOIN  Dim_Product  P  EN  F . Product_id  =  P . Id INNER  JOIN  Dim_Brand  B  EN  P . Brand_Id  =  B . Id INNER  JOIN  Dim_Product_Category  C  EN  P . Product_Category_Id  =  C . Identificación del DONDE D . Año  =  1997  Y C . Product_Category  =  'tv' GROUP  BYB . Marca , G . País

Ver también [ editar ]

  • Esquema de estrella
  • Almacén de datos
  • Procesamiento analítico en línea (OLAP)

Referencias [ editar ]

  1. ^ Paulraj Ponniah. Fundamentos de almacenamiento de datos para profesionales de TI. Wiley, 2010, págs. 29–32. ISBN  0470462078 .
  2. ^ Han, Jiawei (2012). Minería de datos: conceptos y técnicas . Massachusettes, Estados Unidos: Morgan Kauffmann Publishers. ISBN 9780123814791.
  3. ^ Wilkie, Michelle (2009). "Uso de SAS® OLAP Server para un escenario ROLAP" (PDF) . Foro Global SAS 2009 . Consultado el 27 de febrero de 2013 .
  4. ^ Kimball, Ralph (1996). "6: Las grandes dimensiones". El kit de herramientas de almacenamiento de datos (1ª ed.). Wiley. págs.  95–98 . ISBN 0-471-15337-0. No copos de nieve sus dimensiones, incluso si son grandes

Bibliografía [ editar ]

  • Anahory, S .; D. Murray. Almacenamiento de datos en el mundo real: una guía práctica para la creación de sistemas de apoyo a la toma de decisiones . Addison Wesley Professional.
  • Kimball, Ralph (1996). El kit de herramientas de almacenamiento de datos . John Wiley.

Enlaces externos [ editar ]

  • " ¿Por qué el esquema de copo de nieve es un buen diseño de almacén de datos? " Por Mark Levene y George Loizou
  • Uniones de copo de nieve inversas