En estadística , la prueba de Levene es una estadística inferencial que se utiliza para evaluar la igualdad de varianzas de una variable calculada para dos o más grupos. [1] Algunos procedimientos estadísticos comunes asumen que las variaciones de las poblaciones de las que se extraen diferentes muestras son iguales. La prueba de Levene evalúa esta suposición. Prueba la hipótesis nula de que las varianzas de la población son iguales (lo que se denomina homogeneidad de varianza u homocedasticidad ). Si el valor p resultantede la prueba de Levene es menor que algún nivel de significancia (típicamente 0.05), es poco probable que las diferencias obtenidas en las varianzas de la muestra hayan ocurrido en base al muestreo aleatorio de una población con varianzas iguales. Así, se rechaza la hipótesis nula de varianzas iguales y se concluye que existe una diferencia entre las varianzas en la población.
Algunos de los procedimientos que generalmente asumen homocedasticidad, para los cuales se pueden usar las pruebas de Levene, incluyen análisis de varianza y pruebas t .
La prueba de Levene se usa a menudo antes de una comparación de medias. Cuando la prueba de Levene muestra significancia, uno debe cambiar a pruebas más generalizadas que estén libres de supuestos de homocedasticidad (a veces incluso pruebas no paramétricas). La prueba t de Welch , o la prueba t de varianzas desiguales, es una prueba más conservadora.
La prueba de Levene también se puede utilizar como prueba principal para responder una pregunta independiente sobre si dos submuestras en una población dada tienen varianzas iguales o diferentes. [2]
Definición
La prueba de Levene es equivalente a un análisis de varianza entre grupos de una vía (ANOVA), siendo la variable dependiente el valor absoluto de la diferencia entre una puntuación y la media del grupo al que pertenece la puntuación (que se muestra a continuación como ). La estadística de prueba,, es equivalente a la estadística que se produciría mediante dicho ANOVA, y se define de la siguiente manera:
dónde
- es el número de grupos diferentes a los que pertenecen los casos muestreados,
- es el número de casos en el th grupo,
- es el número total de casos en todos los grupos,
- es el valor de la variable medida para elel caso de la th grupo,
(Ambas definiciones están en uso, aunque la segunda es, estrictamente hablando, la prueba de Brown-Forsythe ; consulte la comparación a continuación).
- es la media de la para grupo ,
- es la media de todos .
La estadística de prueba se distribuye aproximadamente en F con y grados de libertad, y de ahí el significado del resultado de probado contra dónde es un cuantil de la distribución F, con y grados de libertad, y es el nivel de significancia elegido (generalmente 0.05 o 0.01).
Comparación con la prueba de Brown-Forsythe
La prueba de Brown-Forsythe utiliza la mediana en lugar de la media para calcular la dispersión dentro de cada grupo ( vs. , sobre). Si bien la elección óptima depende de la distribución subyacente, se recomienda la definición basada en la mediana como la opción que proporciona una buena solidez frente a muchos tipos de datos no normales al tiempo que conserva un buen poder estadístico . [2] Si uno tiene conocimiento de la distribución subyacente de los datos, esto puede indicar el uso de una de las otras opciones. Brown y Forsythe realizaron estudios de Monte Carlo que indicaron que el uso de la media recortada se desempeñó mejor cuando los datos subyacentes siguieron una distribución de Cauchy (una distribución de cola pesada ) y la mediana se desempeñó mejor cuando los datos subyacentes siguieron una distribución de chi-cuadrado con cuatro grados de libertad (una distribución muy sesgada ). El uso de la media proporcionó la mejor potencia para distribuciones simétricas de colas moderadas.
Ver también
Referencias
- ^ Levene, Howard (1960). "Pruebas robustas de igualdad de varianzas". En Ingram Olkin ; Harold Hotelling ; et al. (eds.). Contribuciones a la probabilidad y la estadística: ensayos en honor a Harold Hotelling . Prensa de la Universidad de Stanford. págs. 278-292.
- ^ a b Derrick, B; Ruck, A; Al rebaño; Blanco, P (2018). "Pruebas de igualdad de varianzas entre dos muestras que contienen observaciones pareadas y observaciones independientes" (PDF) . Revista de métodos cuantitativos aplicados . 13 (2): 36–47.