En estadística , particularmente en análisis de varianza y regresión lineal , un contraste es una combinación lineal de variables ( parámetros o estadísticos ) cuyos coeficientes suman cero, lo que permite la comparación de diferentes tratamientos. [1] [2]
Definiciones
Dejar ser un conjunto de variables, ya sean parámetros o estadísticas , yser constantes conocidas. La cantidades una combinación lineal. Se llama contraste si. [3] [4] Además, dos contrastes, y , son ortogonales si. [5]
Ejemplos de
Imaginemos que estamos comparando cuatro medias, . La siguiente tabla describe tres posibles contrastes:
1 | -1 | 0 | 0 |
0 | 0 | 1 | -1 |
1 | 1 | -1 | -1 |
El primer contraste permite comparar la primera media con la segunda, el segundo contraste permite comparar la tercera media con la cuarta y el tercer contraste permite comparar la media de las dos primeras medias con la media de las dos últimas. [4]
En un análisis de varianza equilibrado unidireccional , el uso de contrastes ortogonales tiene la ventaja de dividir completamente la suma de cuadrados del tratamiento en componentes aditivos no superpuestos que representan la variación debida a cada contraste. [6] Considere los números anteriores: cada una de las filas suma cero (por lo tanto, son contrastes). Si multiplicamos cada elemento de la primera y segunda fila y los sumamos, esto nuevamente da como resultado cero, por lo que el primer y el segundo contraste son ortogonales y así sucesivamente.
Conjuntos de contraste
- Los contrastes ortogonales son un conjunto de contrastes en los que, para cualquier par distinto, la suma de los productos cruzados de los coeficientes es cero (suponga que los tamaños de muestra son iguales). [7] Aunque existen conjuntos potencialmente infinitos de contrastes ortogonales, dentro de cualquier conjunto dado siempre habrá un máximo de exactamente k - 1 posibles contrastes ortogonales (donde k es el número de medias de grupo disponibles). [8]
- Los contrastes polinomiales son un conjunto especial de contrastes ortogonales que prueban patrones polinomiales en datos con más de dos medias (por ejemplo, lineal, cuadrática, cúbica, cuártica, etc.). [9]
- Los contrastes ortonormales son contrastes ortogonales que satisfacen la condición adicional de que, para cada contraste, la suma de los cuadrados de los coeficientes sume uno. [7]
Fondo
Un contraste se define como la suma de la media de cada grupo multiplicada por un coeficiente para cada grupo (es decir, un número con signo, c j ). [10] En forma de ecuación,, donde L es la suma ponderada de las medias del grupo, los coeficientes c j representan los pesos asignados de las medias (estos deben sumar 0 para los contrastes ortogonales), yj representa las medias del grupo. [8] Los coeficientes pueden ser positivos o negativos, y fracciones o números enteros, según la comparación de interés. Los contrastes lineales son muy útiles y se pueden usar para probar hipótesis complejas cuando se usan junto con ANOVA o regresión múltiple. En esencia, cada contraste define y prueba un patrón particular de diferencias entre los medios. [10]
Los contrastes deben construirse "para responder a preguntas de investigación específicas", y no necesariamente tienen que ser ortogonales. [11]
Un contraste simple (no necesariamente ortogonal) es la diferencia entre dos medias. Un contraste más complejo puede probar las diferencias entre varias medias (por ejemplo, con cuatro medias, asignando coeficientes de –3, –1, +1 y +3), o probar la diferencia entre una sola media y la media combinada de varios grupos ( Por ejemplo, si tiene cuatro medias, asigne coeficientes de –3, +1, +1 y +1) o pruebe la diferencia entre la media combinada de varios grupos y la media combinada de varios otros grupos (es decir, con cuatro medias, asigne coeficientes de –1, –1, +1 y +1). [8] Los coeficientes de las medias a combinar (o promediar) deben ser iguales en magnitud y dirección, es decir, igualmente ponderados. Cuando a las medias se les asignan coeficientes diferentes (ya sea en magnitud o dirección, o en ambos), el contraste está probando una diferencia entre esas medias. Un contraste puede ser cualquiera de: el conjunto de coeficientes utilizados para especificar una comparación; el valor específico de la combinación lineal obtenida para un estudio o experimento determinado; la cantidad aleatoria definida aplicando la combinación lineal a los efectos del tratamiento cuando estos mismos se consideran variables aleatorias. En el último contexto, a veces se utiliza el término variable de contraste .
A veces se utilizan contrastes para comparar efectos mixtos . Un ejemplo común es la diferencia entre dos resultados de exámenes: uno al comienzo del semestre y otro al final. Tenga en cuenta que no estamos interesados en uno de estos puntajes por sí solo, sino solo en el contraste (en este caso, la diferencia). Dado que se trata de una combinación lineal de variables independientes, su varianza es igual a la suma ponderada de las varianzas de los sumandos; en este caso ambos pesos son uno. Esta "combinación" de dos variables en una puede ser útil en muchos casos, como ANOVA , regresión o incluso como estadística descriptiva por derecho propio.
Un ejemplo de contraste complejo sería comparar 5 tratamientos estándar con un tratamiento nuevo, por lo tanto, otorgar a cada tratamiento anterior una media de 1/5 y al nuevo sexto tratamiento una ponderación de -1 (utilizando la ecuación anterior). Si esta nueva combinación lineal tiene una media de cero, esto significará que no hay evidencia de que los tratamientos antiguos sean diferentes del tratamiento nuevo en promedio. Si la suma de la nueva combinación lineal es positiva, existe alguna evidencia (la fuerza de la evidencia a menudo se asocia con el valor p calculado en esa combinación lineal) de que la media combinada de los 5 tratamientos estándar es mayor que la del nuevo tratamiento. significar. Se obtienen conclusiones análogas cuando la combinación lineal es negativa. [10] Sin embargo, la suma de la combinación lineal no es una prueba de significación, consulte Prueba de significación (a continuación) para aprender a determinar si el contraste calculado a partir de la muestra es significativo.
Los resultados habituales para combinaciones lineales de variables aleatorias independientes significan que la varianza de un contraste es igual a la suma ponderada de las varianzas. [12] Si dos contrastes son ortogonales , las estimaciones creadas utilizando dichos contrastes no estarán correlacionadas . Si se dispone de contrastes ortogonales, es posible resumir los resultados de un análisis estadístico en forma de una tabla de análisis de varianza simple, de tal manera que contenga los resultados para diferentes estadísticos de prueba relacionados con diferentes contrastes, cada uno de los cuales es estadísticamente independiente. Los contrastes lineales se pueden convertir fácilmente en sumas de cuadrados . Contraste SS =, con 1 grado de libertad , donde n representa el número de observaciones por grupo. Si los contrastes son ortogonales, la suma de los contrastes SS = tratamiento SS . Probar la importancia de un contraste requiere el cálculo del contraste SS . [8]
Prueba de importancia
El contraste SS también resulta ser un cuadrado medio porque todos los contrastes tienen 1 grado de libertad. Divisor por produce una estadística F con uno ygrados de libertad, la significancia estadística del contraste F se puede determinar comparando el estadístico F obtenido con un valor crítico de F con los mismos grados de libertad. [8]
Referencias
- Casella, George; Berger, Roger L (2001). Inferencia estadística . Aprendizaje Cengage. ISBN 9780534243128.
- George Casella (2008). Diseño estadístico . Springer . ISBN 978-0-387-75965-4.
- Everitt, BS; Skrondal, A (2010). Diccionario de estadística de Cambridge (4ª ed.). Prensa de la Universidad de Cambridge . ISBN 9780521766999.
- Dean, Angela M .; Voss, Daniel (1999). Diseño y análisis de experimentos . Springer . ISBN 9780387985619.
enlaces externos
- Ejemplos de contrastes ortogonales para análisis de varianza
- Análisis de contraste (Abdi y Williams, 2010)
Notas
- ^ Casella, George; Berger, Roger L (2001). Inferencia estadística . Aprendizaje Cengage. ISBN 9780534243128.
- ^ George Casella (2008). Diseño estadístico . Springer . ISBN 978-0-387-75965-4.
- ^ Casella a Berger, 2001, p. 526.
- ↑ a b Casella, 2008, p. 11.
- ^ Casella, 2008, p. 12.
- ^ Casella, 2008, p. 13.
- ^ a b Everitt, BS (2002) El diccionario de estadística de Cambridge , CUP. ISBN 0-521-81099-X (entrada para "Contrastes ortogonales")
- ^ a b c d e Howell, David C. (2010). Métodos estadísticos para la psicología (7ª ed.). Belmont, CA: Thomson Wadsworth. ISBN 978-0-495-59784-1.
- ^ Kim, Jong Sung. "Contrastes polinomiales ortogonales" (PDF) . Consultado el 27 de abril de 2012 .
- ^ a b c Clark, James M. (2007). Análisis de datos intermedios: regresión múltiple y análisis de varianza . Universidad de Winnipeg.
- ^ Kuehl, Robert O. (2000). Diseño de experimentos: principios estadísticos del diseño y análisis de la investigación (2ª ed.). Pacific Grove, CA: Duxbury / Thomson Learning. ISBN 0534368344.
- ^ Manual electrónico de métodos estadísticos de NIST / SEMATECH