Análisis secuencial

En estadística , el análisis secuencial o la prueba de hipótesis secuencial es un análisis estadístico en el que el tamaño de la muestra no se fija de antemano. En su lugar, los datos se evalúan a medida que se recopilan, y el muestreo adicional se detiene de acuerdo con una regla de detención predefinida tan pronto como se observan resultados significativos. Por lo tanto, a veces se puede llegar a una conclusión en una etapa mucho más temprana de lo que sería posible con pruebas o estimaciones de hipótesis más clásicas , con un costo financiero y / o humano en consecuencia más bajo.

Historia

El método de análisis secuencial se atribuye primero a Abraham Wald ^[1] con Jacob Wolfowitz , W. Allen Wallis y Milton Friedman ^[2] mientras estaban en el Grupo de Investigación Estadística de la Universidad de Columbia como una herramienta para un control de calidad industrial más eficiente durante la Segunda Guerra Mundial . Su valor para el esfuerzo bélico fue inmediatamente reconocido y llevó a recibir una clasificación "restringida" . ^[3] Al mismo tiempo, George Barnard dirigió un grupo que trabajaba en una parada óptima en Gran Bretaña. Otra contribución temprana al método fue hecha por KJ Arrow con D. Blackwell y MA Girshick. ^[4]

Un enfoque similar fue desarrollado independientemente a partir de los primeros principios aproximadamente al mismo tiempo por Alan Turing , como parte de la técnica Banburismus utilizada en Bletchley Park , para probar hipótesis sobre si diferentes mensajes codificados por máquinas Enigma alemanas deberían conectarse y analizarse juntos. Este trabajo permaneció en secreto hasta principios de la década de 1980. ^[5]

Peter Armitage introdujo el uso del análisis secuencial en la investigación médica, especialmente en el área de los ensayos clínicos. Los métodos secuenciales se hicieron cada vez más populares en la medicina a raíz del trabajo de Stuart Pocock que proporcionaba recomendaciones claras sobre cómo controlar las tasas de error de tipo 1 en diseños secuenciales. ^[6]

Funciones de gasto alfa

Cuando los investigadores analizan repetidamente los datos a medida que se agregan más observaciones, aumenta la probabilidad de un error de tipo 1 . Por lo tanto, es importante ajustar el nivel alfa en cada análisis intermedio, de modo que la tasa de error de tipo 1 general se mantenga en el nivel deseado. Esto es conceptualmente similar al uso de la corrección de Bonferroni , pero debido a que las miradas repetidas a los datos son dependientes, se pueden usar correcciones más eficientes para el nivel alfa. Entre las primeras propuestas se encuentra el límite de Pocock . Existen formas alternativas de controlar la tasa de error de Tipo 1, como los límites Haybittle-Peto , y O'Brien & Fleming ^[7] y Wang & Tsiatis han realizado trabajos adicionales para determinar los límites para los análisis intermedios . ^[8]

Una limitación de las correcciones, como el límite de Pocock, es que el número de miradas a los datos debe determinarse antes de que se recopilen los datos, y que las miradas a los datos deben estar igualmente espaciadas (por ejemplo, después de 50, 100, 150 y 200 pacientes). El enfoque de la función de gasto alfa desarrollado por Demets & Lan ^[9] no tiene estas restricciones y, dependiendo de los parámetros elegidos para la función de gasto, puede ser muy similar a los límites de Pocock o las correcciones propuestas por O'Brien y Fleming.

Aplicaciones del análisis secuencial

Ensayos clínicos

En un ensayo aleatorizado con dos grupos de tratamiento, la prueba secuencial de grupo se puede realizar, por ejemplo, de la siguiente manera: Después de que estén disponibles n sujetos en cada grupo, se realiza un análisis intermedio. Se realiza una prueba estadística para comparar los dos grupos y si se rechaza la hipótesis nula se da por terminado el ensayo; de lo contrario, el ensayo continúa, se reclutan otros n sujetos por grupo y se vuelve a realizar la prueba estadística, incluidos todos los sujetos. Si se rechaza el nulo, se da por terminado el ensayo y, en caso contrario, continúa con evaluaciones periódicas hasta que se haya realizado un número máximo de análisis intermedios, momento en el que se realiza la última prueba estadística y se interrumpe el ensayo. ^[10]

Otras aplicaciones

El análisis secuencial también tiene una conexión con el problema de la ruina del jugador que ha sido estudiado, entre otros, por Huygens en 1657. ^[11]

La detección de pasos es el proceso de encontrar cambios abruptos en el nivel medio de una serie de tiempo o señal. Por lo general, se considera como un tipo especial de método estadístico conocido como detección de punto de cambio . A menudo, el paso es pequeño y la serie de tiempo se corrompe por algún tipo de ruido, y esto dificulta el problema porque el paso puede estar oculto por el ruido. Por lo tanto, a menudo se requieren algoritmos estadísticos y / o de procesamiento de señales. Cuando los algoritmos se ejecutan en línea a medida que ingresan los datos, especialmente con el objetivo de producir una alerta, esta es una aplicación de análisis secuencial.

Parcialidad

Los ensayos que se terminan anticipadamente porque rechazan la hipótesis nula suelen sobrestimar el verdadero tamaño del efecto. ^[12] Esto se debe a que en muestras pequeñas, solo las estimaciones de gran tamaño del efecto producirán un efecto significativo y la posterior finalización de un ensayo. Se han propuesto métodos para corregir las estimaciones del tamaño del efecto en ensayos individuales. ^[13] Tenga en cuenta que este sesgo es principalmente problemático al interpretar estudios individuales. En los metanálisis, los tamaños del efecto sobrestimados debido a la interrupción temprana se equilibran con la subestimación en los ensayos que se detienen tarde, lo que lleva a Schou & Marschner a concluir que "la interrupción temprana de los ensayos clínicos no es una fuente sustancial de sesgo en los metanálisis". ^[14]

El significado de los valores p en los análisis secuenciales también cambia, porque cuando se utilizan análisis secuenciales, se realiza más de un análisis, y la definición típica de un valor p como los datos "al menos tan extremos" como se observa debe redefinirse. . Una solución es ordenar los valores p de una serie de pruebas secuenciales basadas en el tiempo de parada y qué tan alto fue el estadístico de prueba en un aspecto dado, lo que se conoce como ordenamiento por etapas, ^[15] propuesto por primera vez por Armitage .

Ver también

Parada óptima
Estimación secuencial
Prueba secuencial de razón de probabilidad

Notas

^ Wald, Abraham (junio de 1945). "Pruebas secuenciales de hipótesis estadísticas" . Los Anales de Estadística Matemática . 16 (2): 117–186. doi : 10.1214 / aoms / 1177731118 . JSTOR 2235829 .
^ Berger, James (2008). Análisis secuencial . El Diccionario de Economía New Palgrave, 2ª Ed . págs. 438–439. doi : 10.1057 / 9780230226203.1513 . ISBN 978-0-333-78676-5.
^ Weigl, Hans Günter (2013). Abraham Wald: un estadístico como figura clave de la econometría moderna (PDF) (Tesis doctoral). Universidad de Hamburgo.
^ Kenneth J. Arrow , David Blackwell y MA Girshick (1949). "Bayes y soluciones minimax de problemas de decisión secuencial". Econometrica . 17 (3/4): 213–244. doi : 10.2307 / 1905525 . JSTOR 1905525 .
^ Randell, Brian (1980), "El coloso", Una historia de la informática en el siglo XX , p. 30
^ W., Turnbull, Bruce (2000). Agrupar métodos secuenciales con aplicaciones a ensayos clínicos . Chapman y Hall. ISBN 9780849303166. OCLC 900071609 .
^ O'Brien, Peter C .; Fleming, Thomas R. (1 de enero de 1979). "Un procedimiento de prueba múltiple para ensayos clínicos". Biometría . 35 (3): 549–556. doi : 10.2307 / 2530245 . JSTOR 2530245 . PMID 497341 .
^ Wang, Samuel K .; Tsiatis, Anastasios A. (1 de enero de 1987). "Límites de un parámetro aproximadamente óptimos para ensayos secuenciales de grupo". Biometría . 43 (1): 193-199. doi : 10.2307 / 2531959 . JSTOR 2531959 .
^ Demets, David L .; Lan, KK Gordon (15 de julio de 1994). "Análisis intermedio: el enfoque de la función de gasto alfa". Estadística en Medicina . 13 (13-14): 1341-1352. doi : 10.1002 / sim.4780131308 . ISSN 1097-0258 . PMID 7973215 .
^ Korosteleva, Olga (2008). Estadísticas clínicas: introducción de ensayos clínicos, análisis de supervivencia y análisis de datos longitudinales (primera edición). Jones y Bartlett Publishers . ISBN 978-0-7637-5850-9.
^ Ghosh, BK; Sen, PK (1991). Manual de análisis secuencial . Nueva York: Marcel Dekker . ISBN 9780824784089.^{[ página necesaria ]}
^ Proschan, Michael A .; Lan, KK Gordan; Wittes, Janet Turk (2006). Seguimiento estadístico de los ensayos clínicos: un enfoque unificado . Saltador. ISBN 9780387300597. OCLC 553888945 .
^ Liu, A .; Hall, WJ (1 de marzo de 1999). "Estimación imparcial siguiendo una prueba secuencial de grupo" . Biometrika . 86 (1): 71–78. doi : 10.1093 / biomet / 86.1.71 . ISSN 0006-3444 .
^ Schou, I. Manjula; Marschner, Ian C. (10 de diciembre de 2013). "Metanálisis de ensayos clínicos con detención anticipada: una investigación de posibles sesgos". Estadística en Medicina . 32 (28): 4859–4874. doi : 10.1002 / sim.5893 . ISSN 1097-0258 . PMID 23824994 .
^ Gordan., Lan, KK; Turk., Wittes, Janet (1 de enero de 2007). Seguimiento estadístico de los ensayos clínicos: un enfoque unificado . Saltador. ISBN 9780387300597. OCLC 553888945 .

Referencias

Wald, Abraham (1947). Análisis secuencial . Nueva York: John Wiley and Sons .
Bartroff, J., Lai TL y Shih, M.-C. (2013) Experimentación secuencial en ensayos clínicos: diseño y análisis. Saltador.
Ghosh, Bhaskar Kumar (1970). Pruebas secuenciales de hipótesis estadísticas . Lectura: Addison-Wesley .
Chernoff, Herman (1972). Análisis secuencial y diseño óptimo . SIAM .
Siegmund, David (1985). Análisis secuencial . Springer Series en Estadística. Nueva York: Springer-Verlag . ISBN 978-0-387-96134-7.
Bakeman, R., Gottman, JM, (1997) Observing Interaction: An Introduction to Sequential Analysis, Cambridge: Cambridge University Press
Jennison, C. y Turnbull, BW (2000) Agrupar métodos secuenciales con aplicaciones a ensayos clínicos. Chapman y Hall / CRC.
Whitehead, J. (1997). El diseño y análisis de ensayos clínicos secuenciales, 2ª edición. John Wiley e hijos.

enlaces externos

R paquete: Wald de probabilidad secuencial prueba de la ratio por OnlineMarketr.com
Software para realizar análisis secuencial y aplicaciones de análisis secuencial en el estudio de la interacción grupal en la comunicación mediada por computadora por el Dr. Allan Jeong de la Universidad Estatal de Florida

Comercial

El software PASS Sample Size incluye funciones para la configuración de diseños secuenciales grupales.

[1] Wald, Abraham (junio de 1945). "Pruebas secuenciales de hipótesis estadísticas" . Los Anales de Estadística Matemática . 16 (2): 117–186. doi : 10.1214 / aoms / 1177731118 . JSTOR 2235829 .

[2] Berger, James (2008). Análisis secuencial . El Diccionario de Economía New Palgrave, 2ª Ed . págs. 438–439. doi : 10.1057 / 9780230226203.1513 . ISBN 978-0-333-78676-5.

[3] Weigl, Hans Günter (2013). Abraham Wald: un estadístico como figura clave de la econometría moderna (PDF) (Tesis doctoral). Universidad de Hamburgo.

[4] Kenneth J. Arrow , David Blackwell y MA Girshick (1949). "Bayes y soluciones minimax de problemas de decisión secuencial". Econometrica . 17 (3/4): 213–244. doi : 10.2307 / 1905525 . JSTOR 1905525 .

[5] Randell, Brian (1980), "El coloso", Una historia de la informática en el siglo XX , p. 30

[6] W., Turnbull, Bruce (2000). Agrupar métodos secuenciales con aplicaciones a ensayos clínicos . Chapman y Hall. ISBN 9780849303166. OCLC 900071609 .

[7] O'Brien, Peter C .; Fleming, Thomas R. (1 de enero de 1979). "Un procedimiento de prueba múltiple para ensayos clínicos". Biometría . 35 (3): 549–556. doi : 10.2307 / 2530245 . JSTOR 2530245 . PMID 497341 .

[8] Wang, Samuel K .; Tsiatis, Anastasios A. (1 de enero de 1987). "Límites de un parámetro aproximadamente óptimos para ensayos secuenciales de grupo". Biometría . 43 (1): 193-199. doi : 10.2307 / 2531959 . JSTOR 2531959 .

[9] Demets, David L .; Lan, KK Gordon (15 de julio de 1994). "Análisis intermedio: el enfoque de la función de gasto alfa". Estadística en Medicina . 13 (13-14): 1341-1352. doi : 10.1002 / sim.4780131308 . ISSN 1097-0258 . PMID 7973215 .

[10] Korosteleva, Olga (2008). Estadísticas clínicas: introducción de ensayos clínicos, análisis de supervivencia y análisis de datos longitudinales (primera edición). Jones y Bartlett Publishers . ISBN 978-0-7637-5850-9.

[11] Ghosh, BK; Sen, PK (1991). Manual de análisis secuencial . Nueva York: Marcel Dekker . ISBN 9780824784089.^{[ página necesaria ]}

[12] Proschan, Michael A .; Lan, KK Gordan; Wittes, Janet Turk (2006). Seguimiento estadístico de los ensayos clínicos: un enfoque unificado . Saltador. ISBN 9780387300597. OCLC 553888945 .

[13] Liu, A .; Hall, WJ (1 de marzo de 1999). "Estimación imparcial siguiendo una prueba secuencial de grupo" . Biometrika . 86 (1): 71–78. doi : 10.1093 / biomet / 86.1.71 . ISSN 0006-3444 .

[14] Schou, I. Manjula; Marschner, Ian C. (10 de diciembre de 2013). "Metanálisis de ensayos clínicos con detención anticipada: una investigación de posibles sesgos". Estadística en Medicina . 32 (28): 4859–4874. doi : 10.1002 / sim.5893 . ISSN 1097-0258 . PMID 23824994 .

[15] Gordan., Lan, KK; Turk., Wittes, Janet (1 de enero de 2007). Seguimiento estadístico de los ensayos clínicos: un enfoque unificado . Saltador. ISBN 9780387300597. OCLC 553888945 .

[1]