Una media winsorizada es una medida estadística de tendencia central winorizada , muy parecida a la media y la mediana , e incluso más similar a la media truncada . Implica el cálculo de la media después de la obtención de valores , reemplazando partes dadas de una distribución de probabilidad o muestra en el extremo alto y bajo con los valores restantes más extremos, [1] típicamente haciéndolo para una cantidad igual de ambos extremos; a menudo se reemplazan del 10 al 25 por ciento de los extremos. La media winorizada se puede expresar de forma equivalente como un promedio ponderado de la media truncada y los cuantiles a los que se limita, lo que corresponde a la sustitución de partes por los cuantiles correspondientes.
Ventajas
La media winsorizada es un estimador útil porque es menos sensible a los valores atípicos que la media, pero todavía dará una estimación razonable de la tendencia central o media para casi todos los modelos estadísticos. En este sentido, se lo conoce como un estimador robusto .
Inconvenientes
La media winsorizada utiliza más información de la distribución o muestra que la mediana . Sin embargo, a menos que la distribución subyacente sea simétrica , es poco probable que la media winorizada de una muestra produzca un estimador insesgado para la media o la mediana.
Ejemplo
- Para una muestra de 10 números (desde x 1 , el más pequeño, hasta x 10 el más grande), la media ganada al 10% es
- La clave está en la repetición de x 2 y x 9 : los extras sustituyen a los valores originales x 1 y x 10 que han sido descartados y reemplazados.
- Esto equivale a un promedio ponderado de 0,1 veces el percentil 5 ( x 2 ), 0,8 veces la media recortada del 10% y 0,1 veces el percentil 95 ( x 9 ).
Notas
Referencias
- Wilcox, RR; Keselman, HJ (2003). "Métodos de análisis de datos robustos modernos: medidas de tendencia central". Métodos psicológicos . 8 (3): 254–274. doi : 10.1037 / 1082-989X.8.3.254 . PMID 14596490 .