Experimento aleatorizado

En ciencia , los experimentos aleatorios son los experimentos que permiten la mayor confiabilidad y validez de las estimaciones estadísticas de los efectos del tratamiento. La inferencia basada en la aleatorización es especialmente importante en el diseño experimental y en el muestreo de encuestas .

Diagrama de flujo de cuatro fases (inscripción, asignación de intervención, seguimiento y análisis de datos) de un ensayo aleatorio paralelo de dos grupos, modificado de la Declaración CONSORT 2010 ^[1]

Descripción general

En la teoría estadística del diseño de experimentos , la aleatorización implica la asignación aleatoria de las unidades experimentales entre los grupos de tratamiento . Por ejemplo, si un experimento compara un nuevo fármaco con un fármaco estándar, entonces los pacientes deben ser asignados al nuevo fármaco o al control de fármacos estándar mediante la aleatorización.

La experimentación aleatoria no es fortuita. La aleatorización reduce el sesgo al igualar otros factores que no se han tenido en cuenta explícitamente en el diseño experimental (de acuerdo con la ley de los grandes números ). La aleatorización también produce diseños ignorables , que son valiosos en la inferencia estadística basada en modelos , especialmente bayesiana o basada en verosimilitud . En el diseño de experimentos, el diseño más simple para comparar tratamientos es el "diseño completamente aleatorizado". Puede ocurrir alguna "restricción en la aleatorización" con el bloqueo y los experimentos que tienen factores difíciles de cambiar; Pueden ocurrir restricciones adicionales sobre la aleatorización cuando una aleatorización completa no es factible o cuando es deseable reducir la varianza de los estimadores de efectos seleccionados.

La aleatorización del tratamiento en los ensayos clínicos plantea problemas éticos. En algunos casos, la aleatorización reduce las opciones terapéuticas tanto para el médico como para el paciente, por lo que la aleatorización requiere equilibrio clínico con respecto a los tratamientos.

Experimentos controlados aleatorios en línea

Los sitios web pueden ejecutar experimentos controlados aleatorios ^[2] para crear un ciclo de retroalimentación. ^[3] Las diferencias clave entre la experimentación sin conexión y los experimentos en línea incluyen: ^[3]^[4]

Registro: las interacciones del usuario se pueden registrar de manera confiable.
Número de usuarios: los sitios grandes, como Amazon, Bing / Microsoft y Google realizan experimentos, cada uno con más de un millón de usuarios.
Número de experimentos simultáneos: los sitios grandes ejecutan decenas de experimentos superpuestos o simultáneos. ^[5]
Robots, ya sean rastreadores web de fuentes válidas o robots de Internet maliciosos . ^{[ aclaración necesaria ]}
Capacidad para acelerar experimentos de porcentajes bajos a porcentajes más altos.
La velocidad / rendimiento tiene un impacto significativo en las métricas clave. ^[3]^[6]

Capacidad para utilizar el período previo al experimento como una prueba A / A para reducir la varianza. ^[7]

Historia

Un experimento controlado parece haber sido sugerido en el Libro de Daniel del Antiguo Testamento. El rey Nabucodonosor propuso que algunos israelitas comieran "una cantidad diaria de comida y vino de la mesa del rey". Daniel prefería una dieta vegetariana, pero al funcionario le preocupaba que el rey "¿te vería peor que los otros jóvenes de tu edad? Entonces el rey me cortaría la cabeza por tu culpa". Daniel propuso entonces el siguiente experimento controlado: "Pon a prueba a tus siervos durante diez días. Danos nada más que verduras para comer y agua para beber. Luego compara nuestra apariencia con la de los jóvenes que comen la comida real y trata a tus siervos de acuerdo con con lo que ves ". (Daniel 1, 12-13). ^[8]^[9]

Los experimentos aleatorios se institucionalizaron en psicología y educación a finales del siglo dieciocho, tras la invención de los experimentos aleatorios por CS Peirce . ^[10]^[11]^[12]^[13] Fuera de la psicología y la educación, RA Fisher popularizó los experimentos aleatorios en su libro Statistical Methods for Research Workers , que también introdujo principios adicionales de diseño experimental.

Interpretación estadística

El modelo causal de Rubin proporciona una forma común de describir un experimento aleatorio. Si bien el modelo causal de Rubin proporciona un marco para definir los parámetros causales (es decir, los efectos de un tratamiento aleatorio sobre un resultado), el análisis de experimentos puede tomar varias formas. Por lo general, los experimentos aleatorios se analizan mediante ANOVA , prueba t de Student , análisis de regresión o una prueba estadística similar .

Evidencia empírica de que la aleatorización marca la diferencia

Las diferencias empíricas entre los estudios aleatorizados y no aleatorizados ^[14] y entre los ensayos aleatorizados adecuada o inadecuadamente han sido difíciles de detectar. ^[15]^[16]

Ver también

Pruebas A / B
Ocultamiento de la asignación
Asignación aleatoria
Diseño de bloques aleatorios
Ensayo controlado aleatorio

Referencias

^ Schulz KF, Altman DG, Moher D; para el Grupo CONSORT (2010). "Declaración CONSORT 2010: directrices actualizadas para informar ensayos aleatorios de grupos paralelos" . BMJ . 340 : c332. doi : 10.1136 / bmj.c332 . PMC 2844940 . PMID 20332509 .CS1 maint: varios nombres: lista de autores ( enlace )
^ Kohavi, Ron; Longbotham, Roger (2015). "Experimentos controlados en línea y pruebas A / B" (PDF) . En Sammut, Claude; Webb, Geoff (eds.). Enciclopedia de Machine Learning y Data Mining . Saltador. pp. para aparecer.
^ a b c Kohavi, Ron; Longbotham, Roger; Sommerfield, Dan; Henne, Randal M. (2009). "Experimentos controlados en la web: encuesta y guía práctica" . Minería de datos y descubrimiento de conocimientos . 18 (1): 140–181. doi : 10.1007 / s10618-008-0114-1 . ISSN 1384-5810 .
^ Kohavi, Ron; Deng, Alex; Frasca, Brian; Longbotham, Roger; Walker, Toby; Xu Ya (2012). "Experimentos controlados en línea confiables: cinco resultados desconcertantes explicados" . Actas de la 18ª Conferencia de ACM SIGKDD sobre descubrimiento de conocimiento y minería de datos .
^ Kohavi, Ron; Deng Alex; Frasca Brian; Walker Toby; Xu Ya; Nils Pohlmann (2013). Experimentos controlados en línea a gran escala . Actas de la XIX Conferencia de ACM SIGKDD sobre descubrimiento de conocimiento y minería de datos . 19 . Chicago, Illinois, Estados Unidos: ACM. págs. 1168-1176. doi : 10.1145 / 2487575.2488217 .
^ Kohavi, Ron; Deng Alex; Longbotham Roger; Xu Ya (2014). Siete reglas generales para los experimentadores de sitios web . Actas de la 20ª Conferencia ACM SIGKDD sobre descubrimiento de conocimiento y minería de datos . 20 . Nueva York, Nueva York, Estados Unidos: ACM. págs. 1857–1866. doi : 10.1145 / 2623330.2623341 .
^ Deng, Alex; Xu, Ya; Kohavi, Ron; Walker, Toby (2013). "Mejora de la sensibilidad de los experimentos controlados en línea mediante la utilización de datos previos al experimento" . WSDM 2013: Sexta Conferencia Internacional ACM sobre Búsqueda Web y Minería de Datos .
^ Neuhauser, D; Díaz, M (2004). "Daniel: usando la Biblia para enseñar métodos de mejora de la calidad" . Calidad y seguridad en la atención de la salud . 13 (2): 153-155. doi : 10.1136 / qshc.2003.009480 . PMC 1743807 . PMID 15069225 .
^ Angrist, Joshua; Pischke Jörn-Steffen (2014). Dominar las métricas: el camino de la causa al efecto . Prensa de la Universidad de Princeton. pag. 31.
^ Charles Sanders Peirce y Joseph Jastrow (1885). "Sobre pequeñas diferencias en la sensación" . Memorias de la Academia Nacional de Ciencias . 3 : 73–83. http://psychclassics.yorku.ca/Peirce/small-diffs.htm
^ Hacking, Ian (septiembre de 1988). "Telepatía: orígenes de la aleatorización en el diseño experimental". Isis . 79 (3): 427–451. doi : 10.1086 / 354775 . JSTOR 234674 . Señor 1013489 .
^ Stephen M. Stigler (noviembre de 1992). "Una visión histórica de los conceptos estadísticos en psicología e investigación educativa". Revista estadounidense de educación . 101 (1): 60–70. doi : 10.1086 / 444032 .
^ Trudy Dehue (diciembre de 1997). "Engaño, eficiencia y grupos aleatorios: psicología y el origen gradual del diseño de grupo aleatorio" (PDF) . Isis . 88 (4): 653–673. doi : 10.1086 / 383850 . PMID 9519574 .
^ Anglemyer A, Horvath HT, Bero L (abril de 2014). "Resultados sanitarios evaluados con diseños de estudios observacionales en comparación con los evaluados en ensayos aleatorizados". Cochrane Database Syst Rev . 4 (4): MR000034. doi : 10.1002 / 14651858.MR000034.pub2 . PMID 24782322 .
^ Odgaard-Jensen J, Vist G y col. (Abril de 2011). "Aleatorización para proteger contra el sesgo de selección en los ensayos de salud" . Cochrane Database Syst Rev (4): MR000012. doi : 10.1002 / 14651858.MR000012.pub3 . PMC 7150228 . PMID 21491415 .
^ Howick J, Mebius A (2014). "En busca de una justificación para la paradoja de la imprevisibilidad" . Ensayos . 15 : 480. doi : 10.1186 / 1745-6215-15-480 . PMC 4295227 . PMID 25490908 .

Caliński, Tadeusz y Kageyama, Sanpei (2000). Diseños de bloques: un enfoque de aleatorización, volumen I : análisis . Apuntes de conferencias en estadística. 150 . Nueva York: Springer-Verlag. ISBN 978-0-387-98578-7.
Caliński, Tadeusz y Kageyama, Sanpei (2003). Diseños de bloques: un enfoque de aleatorización, Volumen II : Diseño . Apuntes de conferencias en estadística. 170 . Nueva York: Springer-Verlag. ISBN 978-0-387-95470-7.
Hacking, Ian (septiembre de 1988). "Telepatía: orígenes de la aleatorización en el diseño experimental". Isis . 79 (3): 427–451. doi : 10.1086 / 354775 . JSTOR 234674 . Señor 1013489 .
Hinkelmann, Klaus; Kempthorne, Oscar (2008). Diseño y Análisis de Experimentos, Volumen I: Introducción al Diseño Experimental (Segunda ed.). Wiley. ISBN 978-0-471-72756-9. Señor 2363107 .
Kempthorne, Oscar (1992). "Experimentos de intervención, aleatorización e inferencia" . En Malay Ghosh y Pramod K. Pathak (ed.). Temas actuales en inferencia estadística: ensayos en honor a D. Basu . Notas de conferencias del Instituto de Estadística Matemática - Serie de monografías. Hayward, CA: Instituto de Estadística Matemática. págs. 13–31. doi : 10.1214 / lnms / 1215458836 . ISBN 978-0-940600-24-9. Señor 1194407 .

[Schulz-2010-1] Schulz KF, Altman DG, Moher D; para el Grupo CONSORT (2010). "Declaración CONSORT 2010: directrices actualizadas para informar ensayos aleatorios de grupos paralelos" . BMJ . 340 : c332. doi : 10.1136 / bmj.c332 . PMC 2844940 . PMID 20332509 .CS1 maint: varios nombres: lista de autores ( enlace )

[2] Kohavi, Ron; Longbotham, Roger (2015). "Experimentos controlados en línea y pruebas A / B" (PDF) . En Sammut, Claude; Webb, Geoff (eds.). Enciclopedia de Machine Learning y Data Mining . Saltador. pp. para aparecer.

[surveyarticle-3] Kohavi, Ron; Longbotham, Roger; Sommerfield, Dan; Henne, Randal M. (2009). "Experimentos controlados en la web: encuesta y guía práctica" . Minería de datos y descubrimiento de conocimientos . 18 (1): 140–181. doi : 10.1007 / s10618-008-0114-1 . ISSN 1384-5810 .

[puzzlingResults-4] Kohavi, Ron; Deng, Alex; Frasca, Brian; Longbotham, Roger; Walker, Toby; Xu Ya (2012). "Experimentos controlados en línea confiables: cinco resultados desconcertantes explicados" . Actas de la 18ª Conferencia de ACM SIGKDD sobre descubrimiento de conocimiento y minería de datos .

[ExPScale-5] Kohavi, Ron; Deng Alex; Frasca Brian; Walker Toby; Xu Ya; Nils Pohlmann (2013). Experimentos controlados en línea a gran escala . Actas de la XIX Conferencia de ACM SIGKDD sobre descubrimiento de conocimiento y minería de datos . 19 . Chicago, Illinois, Estados Unidos: ACM. págs. 1168-1176. doi : 10.1145 / 2487575.2488217 .

[ExPRulesOfThumb-6] Kohavi, Ron; Deng Alex; Longbotham Roger; Xu Ya (2014). Siete reglas generales para los experimentadores de sitios web . Actas de la 20ª Conferencia ACM SIGKDD sobre descubrimiento de conocimiento y minería de datos . 20 . Nueva York, Nueva York, Estados Unidos: ACM. págs. 1857–1866. doi : 10.1145 / 2623330.2623341 .

[cuped-7] Deng, Alex; Xu, Ya; Kohavi, Ron; Walker, Toby (2013). "Mejora de la sensibilidad de los experimentos controlados en línea mediante la utilización de datos previos al experimento" . WSDM 2013: Sexta Conferencia Internacional ACM sobre Búsqueda Web y Minería de Datos .

[8] Neuhauser, D; Díaz, M (2004). "Daniel: usando la Biblia para enseñar métodos de mejora de la calidad" . Calidad y seguridad en la atención de la salud . 13 (2): 153-155. doi : 10.1136 / qshc.2003.009480 . PMC 1743807 . PMID 15069225 .

[9] Angrist, Joshua; Pischke Jörn-Steffen (2014). Dominar las métricas: el camino de la causa al efecto . Prensa de la Universidad de Princeton. pag. 31.

[10] Charles Sanders Peirce y Joseph Jastrow (1885). "Sobre pequeñas diferencias en la sensación" . Memorias de la Academia Nacional de Ciencias . 3 : 73–83. http://psychclassics.yorku.ca/Peirce/small-diffs.htm

[11] Hacking, Ian (septiembre de 1988). "Telepatía: orígenes de la aleatorización en el diseño experimental". Isis . 79 (3): 427–451. doi : 10.1086 / 354775 . JSTOR 234674 . Señor 1013489 .

[12] Stephen M. Stigler (noviembre de 1992). "Una visión histórica de los conceptos estadísticos en psicología e investigación educativa". Revista estadounidense de educación . 101 (1): 60–70. doi : 10.1086 / 444032 .

[13] Trudy Dehue (diciembre de 1997). "Engaño, eficiencia y grupos aleatorios: psicología y el origen gradual del diseño de grupo aleatorio" (PDF) . Isis . 88 (4): 653–673. doi : 10.1086 / 383850 . PMID 9519574 .

[14] Anglemyer A, Horvath HT, Bero L (abril de 2014). "Resultados sanitarios evaluados con diseños de estudios observacionales en comparación con los evaluados en ensayos aleatorizados". Cochrane Database Syst Rev . 4 (4): MR000034. doi : 10.1002 / 14651858.MR000034.pub2 . PMID 24782322 .

[15] Odgaard-Jensen J, Vist G y col. (Abril de 2011). "Aleatorización para proteger contra el sesgo de selección en los ensayos de salud" . Cochrane Database Syst Rev (4): MR000012. doi : 10.1002 / 14651858.MR000012.pub3 . PMC 7150228 . PMID 21491415 .

[16] Howick J, Mebius A (2014). "En busca de una justificación para la paradoja de la imprevisibilidad" . Ensayos . 15 : 480. doi : 10.1186 / 1745-6215-15-480 . PMC 4295227 . PMID 25490908 .

[1]