Dispersión estadística


En estadística , la dispersión (también llamada variabilidad , dispersión o propagación ) es la medida en que una distribución se estira o se contrae. [1] Ejemplos comunes de medidas de dispersión estadística son la varianza , la desviación estándar y el rango intercuartílico . Por ejemplo, cuando la varianza de los datos en un conjunto es grande, los datos están muy dispersos. Por otro lado, cuando la varianza es pequeña, los datos del conjunto se agrupan.

La dispersión se contrasta con la ubicación o tendencia central , y juntas son las propiedades más utilizadas de las distribuciones.

Una medida de dispersión estadística es un número real no negativo que es cero si todos los datos son iguales y aumenta a medida que los datos se vuelven más diversos.

La mayoría de las medidas de dispersión tienen las mismas unidades que la cantidad que se mide. En otras palabras, si las medidas son en metros o segundos, también lo es la medida de dispersión. Ejemplos de medidas de dispersión incluyen:

Estos se utilizan con frecuencia (junto con los factores de escala ) como estimadores de parámetros de escala , en cuya capacidad se denominan estimaciones de escala. Las medidas robustas de escala son aquellas que no se ven afectadas por un pequeño número de valores atípicos e incluyen el IQR y MAD.

Todas las medidas anteriores de dispersión estadística tienen la propiedad útil de que son invariantes en la ubicación y de escala lineal . Esto significa que si una variable aleatoria tiene una dispersión de entonces una transformación lineal de verdad y debería tener dispersión , donde es el valor absoluto de , es decir, ignora un signo negativo anterior .


Ejemplo de muestras de dos poblaciones con la misma media pero distinta dispersión. La población azul está mucho más dispersa que la población roja.