En estadística , los cuadrados medios esperados (EMS) son los valores esperados de ciertas estadísticas que surgen en particiones de sumas de cuadrados en el análisis de varianza (ANOVA). Se pueden usar para determinar qué estadística debe aparecer en el denominador en una prueba F para probar una hipótesis nula de que un efecto particular está ausente.
Cuando la suma total corregida de cuadrados en un ANOVA se divide en varios componentes, cada uno atribuido al efecto de una variable predictora particular, cada una de las sumas de cuadrados en esa partición es una variable aleatoria que tiene un valor esperado . Ese valor esperado dividido por el número correspondiente de grados de libertad es el cuadrado medio esperado para esa variable predictora.
El siguiente ejemplo es de Longitudinal Data Analysis de Donald Hedeker y Robert D. Gibbons. [1]
Cada uno de los tratamientos (uno de los cuales puede ser un placebo) se administra a una muestra de (mayúsculas) N pacientes elegidos al azar, en los que determinadas medicionesse observan en cada uno de (minúsculas) n tiempos especificados, para (por lo tanto, el número de pacientes que reciben diferentes tratamientos puede diferir), y Suponemos que los conjuntos de pacientes que reciben diferentes tratamientos son inconexos, por lo que los pacientes se anidan dentro de los tratamientos y no se cruzan con los tratamientos. Tenemos
dónde
- = gran media, (fijo)
- = efecto del tratamiento , (reparado)
- = efecto del tiempo , (reparado)
- = efecto de interacción del tratamiento y tiempo , (reparado)
- = efecto de diferencia individual para el paciente anidado dentro del tratamiento , (aleatorio)
- = error para el paciente en tratamiento en el momento . (aleatorio)
- = varianza del efecto aleatorio de los pacientes anidados dentro de los tratamientos,
- = varianza del error.
La suma total corregida de cuadrados es
La siguiente tabla ANOVA divide la suma de cuadrados (donde ):
fuente de variabilidad | grados de libertad | suma de cuadrados | cuadrado medio | cuadrado medio esperado |
---|
tratamiento | | | | |
hora | | | | |
tratamiento × tiempo | | | | |
pacientes dentro de los tratamientos | | | | |
error | | | | |
Uso en pruebas F
Una hipótesis nula de interés es que no hay diferencia entre los efectos de los diferentes tratamientos, por lo que no hay diferencia entre las medias de los tratamientos. Esto puede expresarse diciendo(con la notación utilizada en la tabla anterior). Bajo esta hipótesis nula, el cuadrado medio esperado para los efectos de los tratamientos es
El numerador en el estadístico F para probar esta hipótesis es el cuadrado medio debido a las diferencias entre los tratamientos, es decir, es El denominador, sin embargo, no es La razón es que la siguiente variable aleatoria, aunque bajo la hipótesis nula tiene una distribución F , no es observable (no es una estadística) porque su valor depende de los parámetros no observables. y
En su lugar, se utiliza como estadística de prueba la siguiente variable aleatoria que no está definida en términos de :