En estadística , la dispersión (también llamada variabilidad , dispersión o dispersión ) es la medida en que una distribución se estira o se contrae. [1] Ejemplos comunes de medidas de dispersión estadística son la varianza , la desviación estándar y el rango intercuartílico .
La dispersión se contrasta con la ubicación o tendencia central , y juntas son las propiedades más utilizadas de las distribuciones.
Medidas
Una medida de dispersión estadística es un número real no negativo que es cero si todos los datos son iguales y aumenta a medida que los datos se vuelven más diversos.
La mayoría de las medidas de dispersión tienen las mismas unidades que la cantidad que se mide. En otras palabras, si las medidas están en metros o segundos, también lo es la medida de dispersión. Ejemplos de medidas de dispersión incluyen:
- Desviación Estándar
- Rango intercuartil (IQR)
- Distancia
- Diferencia absoluta media (también conocida como diferencia absoluta media de Gini)
- Desviación absoluta mediana (MAD)
- Desviación absoluta promedio (o simplemente llamada desviación promedio)
- Desviación estándar de distancia
Estos se utilizan con frecuencia (junto con factores de escala ) como estimadores de parámetros de escala , en cuya capacidad se denominan estimaciones de escala. Las medidas de escala robustas son aquellas que no se ven afectadas por una pequeña cantidad de valores atípicos e incluyen el IQR y MAD.
Todas las medidas anteriores de dispersión estadística tienen la útil propiedad de que son invariantes en la ubicación y lineales en escala . Esto significa que si una variable aleatoria X tiene una dispersión de S X luego una transformación lineal Y = aX + b para real de una y b deben tener dispersión S Y = | a | S X , donde | a | es el valor absoluto de a , es decir, ignora un signo negativo anterior - .
Otras medidas de dispersión son adimensionales . En otras palabras, no tienen unidades incluso si la propia variable tiene unidades. Éstas incluyen:
- Coeficiente de variación
- Coeficiente de dispersión cuartil
- Diferencia media relativa , igual al doble del coeficiente de Gini
- Entropía : mientras que la entropía de una variable discreta es invariante en la ubicación e independiente de la escala y, por lo tanto, no es una medida de dispersión en el sentido anterior, la entropía de una variable continua es invariante en la ubicación y aditiva en la escala: si Hz es la entropía de continua variable de z y z = ax + b , entonces Hz = Hx + log (a) .
Hay otras medidas de dispersión:
- Varianza (el cuadrado de la desviación estándar): invariante en la ubicación pero no lineal en escala.
- Relación de varianza a media : se utiliza principalmente para los datos de recuento cuando se utiliza el término coeficiente de dispersión y cuando esta relación no tiene dimensiones , ya que los datos de recuento son adimensionales en sí mismos, no de otra manera.
Algunas medidas de dispersión tienen propósitos especializados, entre ellos la varianza de Allan y la varianza de Hadamard .
Para las variables categóricas , es menos común medir la dispersión por un solo número; ver variación cualitativa . Una medida que lo hace es la entropía discreta .
Fuentes
En las ciencias físicas , tal variabilidad puede resultar de errores de medición aleatorios: las mediciones de los instrumentos a menudo no son perfectamente precisas, es decir, reproducibles , y existe una variabilidad adicional entre evaluadores al interpretar y reportar los resultados medidos. Se puede suponer que la cantidad que se mide es estable y que la variación entre las mediciones se debe a un error de observación . Un sistema de un gran número de partículas se caracteriza por los valores medios de un número relativamente pequeño de cantidades macroscópicas, como temperatura, energía y densidad. La desviación estándar es una medida importante en la teoría de la fluctuación, que explica muchos fenómenos físicos, incluido por qué el cielo es azul. [2]
En las ciencias biológicas , la cantidad que se mide rara vez es invariable y estable, y la variación observada también puede ser intrínseca al fenómeno: puede deberse a la variabilidad interindividual , es decir, distintos miembros de una población que difieren entre sí. Además, puede deberse a la variabilidad intraindividual , es decir, un mismo sujeto que difiere en las pruebas realizadas en diferentes momentos o en otras condiciones diferentes. Estos tipos de variabilidad también se observan en el ámbito de los productos manufacturados; incluso allí, el científico meticuloso encuentra variaciones.
En economía , finanzas y otras disciplinas, el análisis de regresión intenta explicar la dispersión de una variable dependiente , generalmente medida por su varianza, utilizando una o más variables independientes, cada una de las cuales tiene una dispersión positiva. La fracción de varianza explicada se llama coeficiente de determinación .
Un orden parcial de dispersión.
Una distribución de preservación de la media (MPS) es un cambio de una distribución de probabilidad A a otra distribución de probabilidad B, donde B se forma al distribuir una o más porciones de la función de densidad de probabilidad de A sin modificar la media (el valor esperado). [3] El concepto de dispersión que conserva la media proporciona un orden parcial de las distribuciones de probabilidad de acuerdo con sus dispersiones: de dos distribuciones de probabilidad, una puede clasificarse como que tiene más dispersión que la otra o, alternativamente, ninguna puede clasificarse como que tiene más dispersión. .
Ver también
- Promedio
- Resumen estadístico
- Variación cualitativa
- Medidas de escala robustas
- Incertidumbre de medicion
Referencias
- ^ Manual electrónico de métodos estadísticos de NIST / SEMATECH. "1.3.6.4. Ubicación y parámetros de escala" . www.itl.nist.gov . Departamento de Comercio de Estados Unidos.
- ^ McQuarrie, Donald A. (1976). Mecánica estadística . Nueva York: Harper & Row. ISBN 0-06-044366-9.
- ^ Rothschild, Michael; Stiglitz, Joseph (1970). "Riesgo creciente I: una definición". Revista de teoría económica . 2 (3): 225–243. doi : 10.1016 / 0022-0531 (70) 90038-4 .