Prueba de Levene

En estadística , la prueba de Levene es una estadística inferencial que se utiliza para evaluar la igualdad de varianzas de una variable calculada para dos o más grupos. ^[1] Algunos procedimientos estadísticos comunes asumen que las variaciones de las poblaciones de las que se extraen diferentes muestras son iguales. La prueba de Levene evalúa esta suposición. Prueba la hipótesis nula de que las varianzas de la población son iguales (lo que se denomina homogeneidad de varianza u homocedasticidad ). Si el valor p resultantede la prueba de Levene es menor que algún nivel de significancia (típicamente 0.05), es poco probable que las diferencias obtenidas en las varianzas de la muestra hayan ocurrido en base al muestreo aleatorio de una población con varianzas iguales. Así, se rechaza la hipótesis nula de varianzas iguales y se concluye que existe una diferencia entre las varianzas en la población.

Algunos de los procedimientos que generalmente asumen homocedasticidad, para los cuales se pueden usar las pruebas de Levene, incluyen análisis de varianza y pruebas t .

La prueba de Levene se usa a menudo antes de una comparación de medias. Cuando la prueba de Levene muestra significancia, uno debe cambiar a pruebas más generalizadas que estén libres de supuestos de homocedasticidad (a veces incluso pruebas no paramétricas). La prueba t de Welch , o la prueba t de varianzas desiguales, es una prueba más conservadora.

La prueba de Levene también se puede utilizar como prueba principal para responder una pregunta independiente sobre si dos submuestras en una población dada tienen varianzas iguales o diferentes. ^[2]

Definición

La prueba de Levene es equivalente a un análisis de varianza entre grupos de una vía (ANOVA), siendo la variable dependiente el valor absoluto de la diferencia entre una puntuación y la media del grupo al que pertenece la puntuación (que se muestra a continuación como ${\ Displaystyle Z_ {ij} = | Y_ {ij} - {\ bar {Y}} _ {i \ cdot} |}$ ). La estadística de prueba, ${\ Displaystyle W}$ , es equivalente a la ${\ Displaystyle F}$ estadística que se produciría mediante dicho ANOVA, y se define de la siguiente manera:

{\ Displaystyle W = {\ frac {(Nk)} {(k-1)}} \ cdot {\ frac {\ sum _ {i = 1} ^ {k} N_ {i} (Z_ {i \ cdot} -Z _ {\ cdot \ cdot}) ^ {2}} {\ sum _ {i = 1} ^ {k} \ sum _ {j = 1} ^ {N_ {i}} (Z_ {ij} -Z_ { i \ cdot}) ^ {2}}},}

dónde

${\ Displaystyle k}$ es el número de grupos diferentes a los que pertenecen los casos muestreados,
${\ Displaystyle N_ {i}}$ es el número de casos en el ${\ Displaystyle i}$ th grupo,
${\ Displaystyle N}$ es el número total de casos en todos los grupos,
${\ Displaystyle Y_ {ij}}$ es el valor de la variable medida para el ${\ Displaystyle j}$ el caso de la ${\ Displaystyle i}$ th grupo,
${\ Displaystyle Z_ {ij} = {\ begin {cases} | Y_ {ij} - {\ bar {Y}} _ {i \ cdot} |, & {\ bar {Y}} _ {i \ cdot} { \ text {es una media del}} i {\ text {-ésimo grupo}}, \\ | Y_ {ij} - {\ tilde {Y}} _ {i \ cdot} |, & {\ tilde {Y }} _ {i \ cdot} {\ text {es una mediana del}} i {\ text {-th grupo}}. \ end {cases}}}$

(Ambas definiciones están en uso, aunque la segunda es, estrictamente hablando, la prueba de Brown-Forsythe ; consulte la comparación a continuación).

${\ Displaystyle Z_ {i \ cdot} = {\ frac {1} {N_ {i}}} \ sum _ {j = 1} ^ {N_ {i}} Z_ {ij}}$ es la media de la ${\ Displaystyle Z_ {ij}}$ para grupo ${\ Displaystyle i}$ ,
${\ Displaystyle Z _ {\ cdot \ cdot} = {\ frac {1} {N}} \ sum _ {i = 1} ^ {k} \ sum _ {j = 1} ^ {N_ {i}} Z_ { ij}}$ es la media de todos ${\ Displaystyle Z_ {ij}}$ .

La estadística de prueba ${\ Displaystyle W}$ se distribuye aproximadamente en F con ${\ Displaystyle k-1}$ y ${\ Displaystyle Nk}$ grados de libertad, y de ahí el significado del resultado ${\ Displaystyle w}$ de ${\ Displaystyle W}$ probado contra ${\ Displaystyle F (\ alpha, k-1, Nk)}$ dónde ${\ Displaystyle F}$ es un cuantil de la distribución F, con ${\ Displaystyle k-1}$ y ${\ Displaystyle Nk}$ grados de libertad, y ${\ Displaystyle \ alpha}$ es el nivel de significancia elegido (generalmente 0.05 o 0.01).

Comparación con la prueba de Brown-Forsythe

La prueba de Brown-Forsythe utiliza la mediana en lugar de la media para calcular la dispersión dentro de cada grupo ( ${\ displaystyle {\ bar {Y}}}$ vs. ${\ Displaystyle {\ tilde {Y}}}$ , sobre). Si bien la elección óptima depende de la distribución subyacente, se recomienda la definición basada en la mediana como la opción que proporciona una buena solidez frente a muchos tipos de datos no normales al tiempo que conserva un buen poder estadístico . ^[2] Si uno tiene conocimiento de la distribución subyacente de los datos, esto puede indicar el uso de una de las otras opciones. Brown y Forsythe realizaron estudios de Monte Carlo que indicaron que el uso de la media recortada se desempeñó mejor cuando los datos subyacentes siguieron una distribución de Cauchy (una distribución de cola pesada ) y la mediana se desempeñó mejor cuando los datos subyacentes siguieron una distribución de chi-cuadrado con cuatro grados de libertad (una distribución muy sesgada ). El uso de la media proporcionó la mejor potencia para distribuciones simétricas de colas moderadas.

Ver también

Referencias

^ Levene, Howard (1960). "Pruebas robustas de igualdad de varianzas". En Ingram Olkin ; Harold Hotelling ; et al. (eds.). Contribuciones a la probabilidad y la estadística: ensayos en honor a Harold Hotelling . Prensa de la Universidad de Stanford. págs. 278-292.
^ ^a ^b Derrick, B; Ruck, A; Al rebaño; Blanco, P (2018). "Pruebas de igualdad de varianzas entre dos muestras que contienen observaciones pareadas y observaciones independientes" (PDF) . Revista de métodos cuantitativos aplicados . 13 (2): 36–47.

enlaces externos

Prueba de Levene paramétrica y no paramétrica en SPSS
http://www.itl.nist.gov/div898/handbook/eda/section3/eda35a.htm

[Levene1960-1] Levene, Howard (1960). "Pruebas robustas de igualdad de varianzas". En Ingram Olkin ; Harold Hotelling ; et al. (eds.). Contribuciones a la probabilidad y la estadística: ensayos en honor a Harold Hotelling . Prensa de la Universidad de Stanford. págs. 278-292.

[patvar-2] Derrick, B; Ruck, A; Al rebaño; Blanco, P (2018). "Pruebas de igualdad de varianzas entre dos muestras que contienen observaciones pareadas y observaciones independientes" (PDF) . Revista de métodos cuantitativos aplicados . 13 (2): 36–47.

[1]