En matemáticas y estadística , la desviación es una medida de la diferencia entre el valor observado de una variable y algún otro valor, a menudo la media de esa variable . El signo de la desviación informa la dirección de esa diferencia (la desviación es positiva cuando el valor observado excede el valor de referencia). La magnitud del valor indica el tamaño de la diferencia.
Tipos
Una desviación que es una diferencia entre un valor observado y el valor real de una cantidad de interés (donde el valor verdadero denota el valor esperado, como la media de la población) es un error.
Una desviación que es la diferencia entre el valor observado y una estimación del valor real (por ejemplo, la media de la muestra; el valor esperado de una muestra puede usarse como una estimación del valor esperado de la población) es un residuo . Estos conceptos son aplicables para datos en los niveles de medición de intervalo y razón .
Desviación absoluta o sin signo
En estadística , la desviación absoluta de un elemento de un conjunto de datos es la diferencia absoluta entre ese elemento y un punto dado. Por lo general, la desviación se calcula del valor central , y se interpreta como algún tipo de promedio , con mayor frecuencia la mediana o, a veces, la media del conjunto de datos:
dónde
- D i es la desviación absoluta,
- x i es el elemento de datos,
- m ( X ) es la medida elegida de tendencia central del conjunto de datos, a veces la media ( ), pero con mayor frecuencia la mediana .
Medidas
Desviación media con signo
Para un estimador insesgado , el promedio de las desviaciones con signo en todo el conjunto de todas las observaciones del valor del parámetro de población no observado tiene un promedio de cero en un número arbitrariamente grande de muestras. Sin embargo, por construcción, el promedio de las desviaciones con signo de los valores del valor medio de la muestra es siempre cero, aunque la desviación con signo promedio de otra medida de tendencia central, como la mediana de la muestra, no necesita ser cero.
Dispersión
Las estadísticas de distribución de desviaciones se utilizan como medidas de dispersión estadística .
- La desviación estándar es la medida de dispersión que se usa con frecuencia: usadesviaciones cuadradas y tiene propiedades deseables, pero no es robusta .
- La desviación absoluta promedio , es la suma de los valores absolutos de las desviaciones dividida por el número de observaciones.
- La desviación absoluta mediana es una estadística sólida que utiliza la mediana, no la media, de las desviaciones absolutas.
- La desviación absoluta máxima es una medida muy poco robusta, que utiliza la desviación absoluta máxima.
Normalización
Las desviaciones tienen unidades de la escala de medición (por ejemplo, metros si se miden longitudes). Uno puede no dimensionalizar de dos maneras.
Una forma es dividiendo por una medida de la escala ( dispersión estadística ), con mayor frecuencia, ya sea la desviación estándar de la población, en la estandarización , o la desviación estándar de la muestra, en studentizing (por ejemplo, studentizados residual ).
En cambio, se puede escalar por ubicación, no por dispersión: la fórmula para una desviación porcentual es el valor observado menos el valor aceptado dividido por el valor aceptado multiplicado por 100%.