Desviación Estándar


En estadística , la desviación estándar es una medida de la cantidad de variación o dispersión de un conjunto de valores. [1] Una desviación estándar baja indica que los valores tienden a estar cerca de la media (también llamada valor esperado ) del conjunto, mientras que una desviación estándar alta indica que los valores se distribuyen en un rango más amplio.

La desviación estándar puede abreviarse SD y se representa más comúnmente en los textos matemáticos y las ecuaciones con la letra griega minúscula sigma σ , para la desviación estándar de la población, o la letra latina s , para la desviación estándar de la muestra.

La desviación estándar de una variable aleatoria , una muestra , una población estadística , un conjunto de datos o una distribución de probabilidad es la raíz cuadrada de su varianza . Es algebraicamente más simple, aunque en la práctica menos robusto , que la desviación absoluta promedio . [2] [3] Una propiedad útil de la desviación estándar es que, a diferencia de la varianza, se expresa en la misma unidad que los datos.

La desviación estándar de una población o muestra y el error estándar de una estadística (por ejemplo, de la media muestral) son bastante diferentes, pero están relacionados. El error estándar de la media muestral es la desviación estándar del conjunto de medias que se encontraría extrayendo un número infinito de muestras repetidas de la población y calculando una media para cada muestra. El error estándar de la media resulta ser igual a la desviación estándar de la población dividida por la raíz cuadrada del tamaño de la muestra, y se estima usando la desviación estándar de la muestra dividida por la raíz cuadrada del tamaño de la muestra. Por ejemplo, el error estándar de una encuesta (lo que se informa como el margen de errorde la encuesta), es la desviación estándar esperada de la media estimada si la misma encuesta se realizara varias veces. Por lo tanto, el error estándar estima la desviación estándar de una estimación, que a su vez mide cuánto depende la estimación de la muestra particular que se tomó de la población.

En ciencias, es común informar tanto la desviación estándar de los datos (como una estadística de resumen) como el error estándar de la estimación (como una medida del error potencial en los hallazgos). Por convención, solo los efectos a más de dos errores estándar de una expectativa nula se consideran "estadísticamente significativos" , una salvaguardia contra una conclusión espuria que en realidad se debe a un error de muestreo aleatorio.

Cuando solo se dispone de una muestra de datos de una población, el término desviación estándar de la muestra o desviación estándar de la muestra puede referirse a la cantidad antes mencionada aplicada a esos datos, o a una cantidad modificada que es una estimación no sesgada de la desviación estándar de la población (la desviación estándar de toda la población).


Un gráfico de distribución normal (o curva en forma de campana) donde cada banda tiene un ancho de 1 desviación estándar. Ver también: regla 68–95–99.7 .
Probabilidad acumulada de una distribución normal con valor esperado 0 y desviación estándar 1
Ejemplo de muestras de dos poblaciones con la misma media pero diferentes desviaciones estándar. La población roja tiene media 100 y DE 10; la población azul tiene media 100 y SD 50.
El azul oscuro es una desviación estándar a cada lado de la media. Para la distribución normal, esto representa el 68,27 por ciento del conjunto; mientras que dos desviaciones estándar de la media (azul oscuro y medio) representan el 95,45 por ciento; tres desviaciones estándar (azul claro, medio y oscuro) representan el 99,73 por ciento; y cuatro desviaciones estándar representan el 99,994 por ciento. Los dos puntos de la curva que están a una desviación estándar de la media también son los puntos de inflexión .
Porcentaje dentro de( z )
z (Porcentaje dentro)
La elipse de desviación estándar (verde) de una distribución normal bidimensional