Diseño de medidas repetidas

El diseño de medidas repetidas es un diseño de investigación que involucra múltiples medidas de la misma variable tomadas en sujetos iguales o emparejados, ya sea en diferentes condiciones o durante dos o más períodos de tiempo. ^[1] Por ejemplo, las mediciones repetidas se recopilan en un estudio longitudinal en el que se evalúan los cambios a lo largo del tiempo.

Estudios cruzados

Un popular estudio de medidas repetidas es el estudio cruzado . Un estudio cruzado es un estudio longitudinal en el que los sujetos reciben una secuencia de diferentes tratamientos (o exposiciones). Si bien los estudios cruzados pueden ser estudios observacionales , muchos estudios cruzados importantes son experimentos controlados . Los diseños cruzados son comunes para experimentos en muchas disciplinas científicas , por ejemplo , psicología , educación , ciencia farmacéutica y atención médica , especialmente medicina.

Los experimentos cruzados, controlados y aleatorizados son especialmente importantes en el cuidado de la salud. En un ensayo clínico aleatorizado , a los sujetos se les asignan tratamientos al azar . Cuando tal ensayo tiene un diseño de medidas repetidas, los sujetos se asignan al azar a una secuencia de tratamientos. Un ensayo clínico cruzado es un diseño de medidas repetidas en el que cada paciente se asigna aleatoriamente a una secuencia de tratamientos, que incluyen al menos dos tratamientos (de los cuales uno puede ser un tratamiento estándar o un placebo ): por lo tanto, cada paciente pasa de un tratamiento a otro.

Casi todos los diseños cruzados tienen "equilibrio", lo que significa que todos los sujetos deben recibir el mismo número de tratamientos y que todos los sujetos participan durante el mismo número de períodos. En la mayoría de los ensayos cruzados, cada sujeto recibe todos los tratamientos.

Sin embargo, muchos diseños de medidas repetidas no son cruzados: el estudio longitudinal de los efectos secuenciales de los tratamientos repetidos no necesita utilizar ningún " cruce ", por ejemplo (Vonesh y Chinchilli; Jones y Kenward).

Usos

Número limitado de participantes: el diseño de medidas repetidas reduce la varianza de las estimaciones de los efectos del tratamiento, lo que permite realizar inferencias estadísticas con menos sujetos. ^[2]
Eficiencia: los diseños de medidas repetidas permiten que muchos experimentos se completen más rápidamente, ya que es necesario capacitar a menos grupos para completar un experimento completo. Por ejemplo, los experimentos en los que cada condición toma solo unos minutos, mientras que el entrenamiento para completar las tareas toma tanto tiempo, si no más.
Análisis longitudinal: los diseños de medidas repetidas permiten a los investigadores monitorear cómo los participantes cambian con el tiempo, tanto en situaciones de corto como de largo plazo.

Efectos de orden

Los efectos de orden pueden ocurrir cuando un participante en un experimento puede realizar una tarea y luego volver a realizarla. Los ejemplos de efectos de orden incluyen la mejora del rendimiento o la disminución del rendimiento, que puede deberse a efectos de aprendizaje, aburrimiento o fatiga. El impacto de los efectos del orden puede ser menor en estudios longitudinales a largo plazo o mediante el contrapeso mediante un diseño cruzado .

Contrapeso

En esta técnica, dos grupos realizan cada uno las mismas tareas o experimentan las mismas condiciones, pero en orden inverso. Con dos tareas o condiciones, se forman cuatro grupos.

Contrapeso
	Tarea / Condición	Tarea / Condición	Observaciones
Grupo A	1	2	El Grupo A realiza la Tarea / Condición 1 primero, luego la Tarea / Condición 2
Grupo B	2	1	El Grupo B realiza la Tarea / Condición 2 primero, luego la Tarea / Condición 1

El contrapeso intenta tener en cuenta dos fuentes importantes de variación sistemática en este tipo de diseño: la práctica y los efectos del aburrimiento. De lo contrario, ambos podrían conducir a un desempeño diferente de los participantes debido a la familiaridad o el cansancio con los tratamientos.

Limitaciones

Puede que no sea posible que cada participante esté en todas las condiciones del experimento (es decir, limitaciones de tiempo, ubicación del experimento, etc.). Los sujetos gravemente enfermos tienden a abandonar los estudios longitudinales, lo que puede sesgar los resultados. En estos casos , serían preferibles los modelos de efectos mixtos, ya que pueden tratar con valores perdidos.

La regresión media puede afectar condiciones con repeticiones significativas. La maduración puede afectar los estudios que se prolongan en el tiempo. Los eventos fuera del experimento pueden cambiar la respuesta entre repeticiones.

ANOVA de medidas repetidas

El análisis de varianza de medidas repetidas (rANOVA) es un enfoque estadístico comúnmente utilizado para los diseños de medidas repetidas. ^[3] Con tales diseños, el factor de medidas repetidas (la variable independiente cualitativa) es el factor intra-sujetos, mientras que la variable cuantitativa dependiente en la que se mide a cada participante es la variable dependiente.

Partición de error

Una de las mayores ventajas de rANOVA, como es el caso de los diseños de medidas repetidas en general, es la capacidad de dividir la variabilidad debido a diferencias individuales. Considere la estructura general del estadístico F :

F = _Tratamiento MS / _Error MS = ( _Tratamiento SS / _Tratamiento df ) / ( _Error SS / _Error df )

En un diseño inter-sujetos hay un elemento de varianza debido a la diferencia individual que se combina con los términos de tratamiento y error:

SS _Total = SS _Tratamiento + SS _Error

df _Total = n - 1

En un diseño de medidas repetidas es posible dividir la variabilidad del sujeto de los términos de tratamiento y error. En tal caso, la variabilidad se puede dividir en variabilidad entre tratamientos (o efectos dentro de los sujetos, excluyendo las diferencias individuales) y variabilidad dentro de los tratamientos. La variabilidad dentro de los tratamientos se puede dividir aún más en variabilidad entre sujetos (diferencias individuales) y error (excluidas las diferencias individuales): ^[4]

SS _Total = SS _{Tratamiento (excluyendo la diferencia individual)} + SS _Sujetos + SS _Error

gl _Total = gl _{Tratamiento (dentro de los sujetos)} + gl _{entre sujetos} + _error gl = ( k - 1) + ( n - 1) + (( n - k ) ( n - 1))

En referencia a la estructura general del estadístico F, está claro que al dividir la variabilidad entre sujetos, el valor F aumentará porque la suma de los cuadrados del término de error será menor, lo que dará como resultado un error MSError menor. Es de destacar que la variabilidad de partición reduce los grados de libertad de la prueba F, por lo tanto, la variabilidad entre sujetos debe ser lo suficientemente significativa como para compensar la pérdida en grados de libertad. Si la variabilidad entre sujetos es pequeña, este proceso puede en realidad reducir el valor F. ^[4]

Supuestos

Como ocurre con todos los análisis estadísticos, deben cumplirse supuestos específicos para justificar el uso de esta prueba. Las infracciones pueden afectar los resultados de forma moderada a grave y, a menudo, provocar una inflación del error de tipo 1 . Con rANOVA, se aplican supuestos estándar univariados y multivariados. ^[5] Los supuestos univariados son:

Normalidad: para cada nivel del factor intra-sujetos, la variable dependiente debe tener una distribución normal .
Esfericidad: las puntuaciones de diferencia calculadas entre dos niveles de un factor intra-sujetos deben tener la misma varianza para la comparación de dos niveles cualesquiera. (Esta suposición solo se aplica si hay más de 2 niveles de la variable independiente).
Aleatoriedad: los casos deben derivarse de una muestra aleatoria y las puntuaciones de los diferentes participantes deben ser independientes entre sí.

La rANOVA también requiere que se cumplan ciertos supuestos multivariados, porque se realiza una prueba multivariante en las puntuaciones de diferencia. Estos supuestos incluyen:

Normalidad multivariante: las puntuaciones de diferencia se distribuyen normalmente de forma multivariante en la población.
Aleatoriedad: los casos individuales deben derivarse de una muestra aleatoria y las puntuaciones de diferencia de cada participante son independientes de las de otro participante.

Prueba F

Al igual que con otras pruebas de análisis de varianza, rANOVA utiliza una estadística F para determinar la significancia. Dependiendo del número de factores intra-sujetos y violaciones de supuestos, es necesario seleccionar la más apropiada de tres pruebas: ^[5]

Prueba ANOVA F univariante estándar: esta prueba se usa comúnmente dados solo dos niveles del factor intra-sujetos (es decir, punto de tiempo 1 y punto de tiempo 2). Esta prueba no se recomienda dados más de 2 niveles del factor intra-sujetos porque la suposición de esfericidad se viola comúnmente en tales casos.
Prueba univariante alternativa ^[6]: estas pruebas dan cuenta de violaciones al supuesto de esfericidad y se pueden usar cuando el factor intra-sujetos excede 2 niveles. El estadístico F es el mismo que en la prueba F de ANOVA univariante estándar, pero se asocia con un valor p más preciso. Esta corrección se realiza ajustando los grados de libertad hacia abajo para determinar el valor F crítico. Normalmente se utilizan dos correcciones: la corrección de efecto invernadero-Geisser y la corrección de Huynh-Feldt. La corrección de Greenhouse-Geisser es más conservadora, pero aborda un problema común de aumentar la variabilidad con el tiempo en un diseño de medidas repetidas. ^[7] La corrección de Huynh-Feldt es menos conservadora, pero no aborda problemas de variabilidad creciente. Se ha sugerido que la parte inferior de Huynh-Feldt se utilice con desviaciones más pequeñas de la esfericidad, mientras que Greenhouse-Geisser se utilice cuando las desviaciones sean grandes.
Prueba multivariante: esta prueba no asume esfericidad, pero también es muy conservadora.

Tamaño del efecto

Una de las estadísticas de tamaño del efecto más comúnmente informadas para rANOVA es el eta-cuadrado parcial (η _p² ). También es común utilizar el η ² multivariante cuando se ha violado el supuesto de esfericidad y se informa la estadística de prueba multivariante. Un tercer estadístico de tamaño del efecto que se informa es el η ² generalizado , que es comparable a η _p² en un ANOVA de medidas repetidas unidireccionales. Se ha demostrado que es una mejor estimación del tamaño del efecto con otras pruebas intraindividuales. ^[8]^[9]

Precauciones

rANOVA no siempre es el mejor análisis estadístico para diseños de medidas repetidas. El rANOVA es vulnerable a los efectos de valores perdidos, imputación, puntos de tiempo no equivalentes entre sujetos y violaciones de la esfericidad. ^[10] Estos problemas pueden resultar en un sesgo de muestreo y tasas infladas de error de Tipo I. ^[11] En tales casos, puede ser mejor considerar el uso de un modelo lineal mixto . ^[12]

Ver también

Análisis de variación
Protocolo de ensayo clínico
Estudio cruzado
Diseño de experimentos
Cuadrados medios esperados
Glosario de diseño experimental
Estudio longitudinal
Curva de crecimiento
Datos perdidos
Modelos mixtos
Analisis multivariable
Estudio observacional
Diseño optimo
Análisis de panel
Panel de datos
Estudio de panel
Aleatorización
Ensayo controlado aleatorio
Diseño de medidas repetidas
Secuencia
Inferencia estadística
Efecto del tratamiento

Notas

^ Salkind, Neil J. "Diseño de medidas repetidas" . Métodos de investigación SAGE . SABIO . Consultado el 8 de enero de 2019 .
^ Barret, Julia R. (2013). "Materia particulada y enfermedad cardiovascular: los investigadores miran hacia los cambios microvasculares" . Perspectivas de salud ambiental . 121 (9): a282. doi : 10.1289 / ehp.121-A282 . PMC 3764084 . PMID 24004855 .
^ Gueorguieva; Krystal (2004). "Move Over ANOVA". Archives of General Psychiatry . 61 (3): 310–7. doi : 10.1001 / archpsyc.61.3.310 . PMID 14993119 .
^ a b Howell, David C. (2010). Métodos estadísticos para la psicología (7ª ed.). Belmont, CA: Thomson Wadsworth. ISBN 978-0-495-59784-1.
^ a b Salkind, Samuel B. Green, Neil J. (2011). Uso de SPSS para Windows y Macintosh: análisis y comprensión de datos (6ª ed.). Boston: Prentice Hall. ISBN 978-0-205-02040-9.
^ Vasey; Thayer (1987). "El problema continuo de falsos positivos en ANOVA de medidas repetidas en psicofisiología: una solución multivariante". Psicofisiología . 24 (4): 479–486. doi : 10.1111 / j.1469-8986.1987.tb00324.x . PMID 3615759 .
^ Parque (1993). "Una comparación del enfoque de ecuación de estimación generalizada con el enfoque de máxima verosimilitud para mediciones repetidas". Stat Med . 12 (18): 1723-1732. doi : 10.1002 / sim.4780121807 . PMID 8248664 .
^ Bakeman (2005). "Estadísticas de tamaño del efecto recomendado para diseños de medidas repetidas" . Métodos de investigación del comportamiento . 37 (3): 379–384. doi : 10.3758 / bf03192707 . PMID 16405133 .
^ Olejnik; Algina (2003). "Estadística generalizada de eta y omega al cuadrado: medidas del tamaño del efecto para algunos diseños de investigación comunes". Métodos psicológicos . 8 (4): 434–447. doi : 10.1037 / 1082-989x.8.4.434 . PMID 14664681 .
^ Gueorguieva; Krystal (2004). "Move Over ANOVA". Archives of General Psychiatry . 61 (3): 310–317. doi : 10.1001 / archpsyc.61.3.310 . PMID 14993119 .
^ Muller; Barton (1989). "Potencia aproximada para ANOVA de medidas repetidas que carece de esfericidad". Revista de la Asociación Estadounidense de Estadística . 84 (406): 549–555. doi : 10.1080 / 01621459.1989.10478802 .
^ Kreuger; Tian (2004). "Una comparación del modelo lineal mixto general y ANOVA de medidas repetidas utilizando un conjunto de datos con múltiples puntos de datos faltantes". Investigación biológica para enfermería . 6 (2): 151-157. doi : 10.1177 / 1099800404267682 . PMID 15388912 .

Referencias

Diseño y análisis de experimentos

Jones, Byron; Kenward, Michael G. (2003). Diseño y análisis de ensayos cruzados (segunda ed.). Londres: Chapman y Hall.
Vonesh, Edward F. y Chinchilli, Vernon G. (1997). Modelos lineales y no lineales para el análisis de medidas repetidas . Londres: Chapman y Hall.

Exploración de datos longitudinales

Davidian, Marie ; David M. Giltinan (1995). Modelos no lineales para datos de medición repetidos . Chapman & Hall / CRC Monografías sobre estadística y probabilidad aplicada. ISBN 978-0-412-98341-2.
Fitzmaurice, Garrett; Davidian, Marie; Verbeke, Geert; Molenberghs, Geert, eds. (2008). Análisis de datos longitudinales . Boca Raton, Florida: Chapman y Hall / CRC. ISBN 978-1-58488-658-7.
Jones, Byron; Kenward, Michael G. (2003). Diseño y análisis de ensayos cruzados (segunda ed.). Londres: Chapman y Hall.
Kim, Kevin y Timm, Neil (2007). " " Modelo de curva de crecimiento y MGLM restringido "(Capítulo 7)". Modelos lineales generales univariados y multivariados: Teoría y aplicaciones con SAS (con 1 CD-ROM para Windows y UNIX) . Estadística: libros de texto y monografías (segunda ed.). Boca Raton, Florida: Chapman & Hall / CRC. ISBN 978-1-58488-634-1.
Kollo, Tõnu y von Rosen, Dietrich (2005). " " Modelos lineales multivariantes "(capítulo 4), especialmente" El modelo de curva de crecimiento y extensiones "(capítulo 4.1)". Estadísticas multivariadas avanzadas con matrices . Matemáticas y sus aplicaciones. 579 . Nueva York: Springer. ISBN 978-1-4020-3418-3.
Kshirsagar, Anant M. y Smith, William Boyce (1995). Curvas de crecimiento . Estadística: libros de texto y monografías. 145 . Nueva York: Marcel Dekker, Inc. ISBN 0-8247-9341-2.
Pan, Jian-Xin y Fang, Kai-Tai (2002). Modelos de curvas de crecimiento y diagnósticos estadísticos . Springer Series en Estadística. Nueva York: Springer-Verlag. ISBN 0-387-95053-2.
Seber, GAF y Wild, CJ (1989). " " Modelos de crecimiento (Capítulo 7) " ". Regresión no lineal . Serie de Wiley en Probabilidad y Estadística Matemática: Probabilidad y Estadística Matemática. Nueva York: John Wiley & Sons, Inc. págs. 325–367. ISBN 0-471-61760-1.
Timm, Neil H. (2002). " " El modelo MANOVA general (GMANOVA) "(Capítulo 3.6.d)". Análisis multivariado aplicado . Springer Texts in Statistics. Nueva York: Springer-Verlag. ISBN 0-387-95347-7.
Vonesh, Edward F. y Chinchilli, Vernon G. (1997). Modelos lineales y no lineales para el análisis de medidas repetidas . Londres: Chapman y Hall. (Tratamiento integral de teoría y práctica)
Conaway, M. (1999, 11 de octubre). Diseño de medidas repetidas. Obtenido el 18 de febrero de 2008 de http://biostat.mc.vanderbilt.edu/twiki/pub/Main/ClinStat/repmeas.PDF
Minke, A. (1997, enero). Realización de análisis de medidas repetidas: consideraciones de diseño experimental. Obtenido el 18 de febrero de 2008 de Ericae.net: http://ericae.net/ft/tamu/Rm.htm
Shaughnessy, JJ (2006). Métodos de investigación en psicología. Nueva York: McGraw-Hill.

enlaces externos

Ejemplos de todos los modelos ANOVA y ANCOVA con hasta tres factores de tratamiento, incluidos bloques aleatorios, parcelas divididas, medidas repetidas y cuadrados latinos, y su análisis en R (Universidad de Southampton)

[1] Salkind, Neil J. "Diseño de medidas repetidas" . Métodos de investigación SAGE . SABIO . Consultado el 8 de enero de 2019 .

[Barret-2] Barret, Julia R. (2013). "Materia particulada y enfermedad cardiovascular: los investigadores miran hacia los cambios microvasculares" . Perspectivas de salud ambiental . 121 (9): a282. doi : 10.1289 / ehp.121-A282 . PMC 3764084 . PMID 24004855 .

[Move_Over_Anova-3] Gueorguieva; Krystal (2004). "Move Over ANOVA". Archives of General Psychiatry . 61 (3): 310–7. doi : 10.1001 / archpsyc.61.3.310 . PMID 14993119 .

[Howell_2010-4] Howell, David C. (2010). Métodos estadísticos para la psicología (7ª ed.). Belmont, CA: Thomson Wadsworth. ISBN 978-0-495-59784-1.

[Salkind-5] Salkind, Samuel B. Green, Neil J. (2011). Uso de SPSS para Windows y Macintosh: análisis y comprensión de datos (6ª ed.). Boston: Prentice Hall. ISBN 978-0-205-02040-9.

[6] Vasey; Thayer (1987). "El problema continuo de falsos positivos en ANOVA de medidas repetidas en psicofisiología: una solución multivariante". Psicofisiología . 24 (4): 479–486. doi : 10.1111 / j.1469-8986.1987.tb00324.x . PMID 3615759 .

[7] Parque (1993). "Una comparación del enfoque de ecuación de estimación generalizada con el enfoque de máxima verosimilitud para mediciones repetidas". Stat Med . 12 (18): 1723-1732. doi : 10.1002 / sim.4780121807 . PMID 8248664 .

[8] Bakeman (2005). "Estadísticas de tamaño del efecto recomendado para diseños de medidas repetidas" . Métodos de investigación del comportamiento . 37 (3): 379–384. doi : 10.3758 / bf03192707 . PMID 16405133 .

[9] Olejnik; Algina (2003). "Estadística generalizada de eta y omega al cuadrado: medidas del tamaño del efecto para algunos diseños de investigación comunes". Métodos psicológicos . 8 (4): 434–447. doi : 10.1037 / 1082-989x.8.4.434 . PMID 14664681 .

[10] Gueorguieva; Krystal (2004). "Move Over ANOVA". Archives of General Psychiatry . 61 (3): 310–317. doi : 10.1001 / archpsyc.61.3.310 . PMID 14993119 .

[11] Muller; Barton (1989). "Potencia aproximada para ANOVA de medidas repetidas que carece de esfericidad". Revista de la Asociación Estadounidense de Estadística . 84 (406): 549–555. doi : 10.1080 / 01621459.1989.10478802 .

[12] Kreuger; Tian (2004). "Una comparación del modelo lineal mixto general y ANOVA de medidas repetidas utilizando un conjunto de datos con múltiples puntos de datos faltantes". Investigación biológica para enfermería . 6 (2): 151-157. doi : 10.1177 / 1099800404267682 . PMID 15388912 .

[1]