prueba F

Una prueba F es cualquier prueba estadística en la que el estadístico de prueba tiene una distribución F bajo la hipótesis nula . Se utiliza con mayor frecuencia cuando se comparan modelos estadísticos que se han ajustado a un conjunto de datos , con el fin de identificar el modelo que mejor se ajusta a la población de la que se tomaron muestras de los datos. Las "pruebas F " exactas surgen principalmente cuando los modelos se han ajustado a los datos utilizando mínimos cuadrados . El nombre fue acuñado por George W. Snedecor , en honor a Sir Ronald A. Fisher. Fisher desarrolló inicialmente la estadística como la razón de varianza en la década de 1920. ^[1]

Además, algunos procedimientos estadísticos, como el método de Scheffé para el ajuste de comparaciones múltiples en modelos lineales, también utilizan pruebas F.

La prueba F es sensible a la no normalidad . ^[2]^[3] En el análisis de varianza (ANOVA), las pruebas alternativas incluyen la prueba de Levene, la prueba de Bartlett y la prueba de Brown-Forsythe . Sin embargo, cuando cualquiera de estas pruebas se realiza para probar la suposición subyacente de homocedasticidad ( es decir , homogeneidad de varianza), como paso preliminar para probar los efectos medios, hay un aumento en la tasa de error Tipo I del experimento . ^[4]

La mayoría de las pruebas F surgen al considerar una descomposición de la variabilidad en una colección de datos en términos de sumas de cuadrados . La estadística de prueba en una prueba F es la relación de dos sumas de cuadrados escaladas que reflejan diferentes fuentes de variabilidad. Estas sumas de cuadrados se construyen de manera que el estadístico tiende a ser mayor cuando la hipótesis nula no es cierta. Para que la estadística siga la distribución F bajo la hipótesis nula, las sumas de los cuadrados deben ser estadísticamente independientes y cada una debe seguir una distribución χ² escalada . Esta última condición está garantizada si los valores de los datos son independientes ydistribuida normalmente con una varianza común .

La prueba F en el análisis de varianza unidireccional se utiliza para evaluar si los valores esperados de una variable cuantitativa dentro de varios grupos predefinidos difieren entre sí. Por ejemplo, suponga que un ensayo médico compara cuatro tratamientos. El ANOVA FLa prueba se puede utilizar para evaluar si alguno de los tratamientos es, en promedio, superior o inferior a los demás frente a la hipótesis nula de que los cuatro tratamientos producen la misma respuesta media. Este es un ejemplo de una prueba "ómnibus", lo que significa que se realiza una sola prueba para detectar cualquiera de varias diferencias posibles. Alternativamente, podríamos realizar pruebas por pares entre los tratamientos (por ejemplo, en el ejemplo del ensayo médico con cuatro tratamientos podríamos realizar seis pruebas entre pares de tratamientos). La ventaja de la prueba ANOVA F es que no necesitamos especificar previamente qué tratamientos se van a comparar, y no necesitamos ajustar para hacer comparaciones múltiples . La desventaja de la prueba ANOVA F es que si rechazamos lahipótesis nula , no sabemos de qué tratamientos se puede decir que son significativamente diferentes de los demás, ni, si la prueba F se realiza en el nivel α, podemos afirmar que el par de tratamientos con la mayor diferencia de medias es significativamente diferente en el nivel α.