La partición recursiva es un método estadístico para el análisis multivariable . [1] La partición recursiva crea un árbol de decisiones que se esfuerza por clasificar correctamente a los miembros de la población dividiéndolos en subpoblaciones basándose en varias variables independientes dicotómicas . El proceso se denomina recursivo porque cada subpoblación puede, a su vez, dividirse un número indefinido de veces hasta que el proceso de división finalice después de que se alcance un criterio de detención particular.
Los métodos de partición recursiva se han desarrollado desde la década de 1980. Los métodos bien conocidos de partición recursiva incluyen el algoritmo ID3 de Ross Quinlan y sus sucesores, C4.5 y C5.0 y árboles de clasificación y regresión . Los métodos de aprendizaje por conjuntos , como los bosques aleatorios, ayudan a superar una crítica común de estos métodos, su vulnerabilidad al sobreajuste de los datos, al emplear diferentes algoritmos y combinar su salida de alguna manera.
Este artículo se centra en la partición recursiva para pruebas de diagnóstico médico , pero la técnica tiene aplicaciones mucho más amplias. Ver árbol de decisiones .
En comparación con el análisis de regresión, que crea una fórmula que los proveedores de atención médica pueden usar para calcular la probabilidad de que un paciente tenga una enfermedad, la partición recursiva crea una regla como 'Si un paciente encuentra x, y o z, probablemente tenga la enfermedad q '.
Una variación es la "partición recursiva lineal de Cox". [2]
Ventajas y desventajas
En comparación con otros métodos multivariables, la partición recursiva tiene ventajas y desventajas.
- Las ventajas son:
- Genera modelos clínicamente más intuitivos que no requieren que el usuario realice cálculos. [3]
- Permite variar la priorización de clasificaciones erróneas para crear una regla de decisión que tenga más sensibilidad o especificidad . [2]
- Puede ser más preciso. [4]
- Las desventajas son:
- No funciona bien para variables continuas [5]
- Puede sobreajustar los datos.
Ejemplos de
Hay ejemplos disponibles del uso de particiones recursivas en la investigación de pruebas de diagnóstico. [6] [7] [8] [9] [10] [11] Goldman utilizó partición recursiva para priorizar la sensibilidad en el diagnóstico de infarto de miocardio entre pacientes con dolor torácico en la sala de emergencias. [11]
Ver también
Referencias
- ^ Breiman, Leo (1984). Árboles de clasificación y regresión . Boca Ratón: Chapman & Hall / CRC. ISBN 978-0-412-04841-8.
- ^ a b Cook EF, Goldman L (1984). "Comparación empírica de técnicas analíticas multivariantes: ventajas y desventajas del análisis de partición recursiva". Revista de Enfermedades Crónicas . 37 (9-10): 721-31. doi : 10.1016 / 0021-9681 (84) 90041-9 . PMID 6501544 .
- ^ James KE, White RF, Kraemer HC (2005). "Validación repetida de la muestra dividida para evaluar la regresión logística y la partición recursiva: una aplicación a la predicción del deterioro cognitivo". Estadística en Medicina . 24 (19): 3019–35. doi : 10.1002 / sim.2154 . PMID 16149128 .
- ^ Kattan MW, Hess KR, Beck JR (1998). "Experimentos para determinar si la partición recursiva (CART) o una red neuronal artificial supera las limitaciones teóricas de la regresión de riesgos proporcionales de Cox". Computación. Biomed. Res . 31 (5): 363–73. doi : 10.1006 / cbmr.1998.1488 . PMID 9790741 .
- ^ Lee JW, Um SH, Lee JB, Mun J, Cho H (2006). "Sistemas de puntuación y estadificación mediante modelado de regresión lineal cox y partición recursiva". Métodos de información en medicina . 45 (1): 37–43. doi : 10.1055 / s-0038-1634034 . PMID 16482368 .
- ^ Fonarow GC, Adams KF, Abraham WT, Yancy CW, Boscardin WJ (2005). "Estratificación del riesgo de mortalidad hospitalaria en insuficiencia cardíaca con descompensación aguda: análisis de árbol de clasificación y regresión" . JAMA . 293 (5): 572–80. doi : 10.1001 / jama.293.5.572 . PMID 15687312 .
- ^ Stiell IG, Wells GA, Vandemheen KL y col. (2001). "La regla canadiense de la columna C para la radiografía en pacientes traumatizados alerta y estables" . JAMA . 286 (15): 1841–8. doi : 10.1001 / jama.286.15.1841 . PMID 11597285 .
- ^ Haydel MJ, Preston CA, Mills TJ, Luber S, Blaudeau E, DeBlieux PM (2000). "Indicaciones de la tomografía computarizada en pacientes con traumatismo craneoencefálico menor". N. Engl. J. Med . 343 (2): 100–5. doi : 10.1056 / NEJM200007133430204 . PMID 10891517 .
- ^ Edworthy SM, Zatarain E, McShane DJ, Bloch DA (1988). "Análisis del conjunto de datos de criterios de lupus ARA de 1982 mediante la metodología de partición recursiva: nuevos conocimientos sobre el mérito relativo de los criterios individuales". J. Rheumatol . 15 (10): 1493–8. PMID 3060613 .
- ^ Stiell IG, Greenberg GH, Wells GA y col. (1996). "Validación prospectiva de una regla de decisión para el uso de radiografía en lesiones agudas de rodilla". JAMA . 275 (8): 611–5. doi : 10.1001 / jama.275.8.611 . PMID 8594242 .
- ^ a b Goldman L, Weinberg M, Weisberg M, et al. (mil novecientos ochenta y dos). "Un protocolo derivado de la computadora para ayudar en el diagnóstico de pacientes de la sala de emergencias con dolor torácico agudo". N. Engl. J. Med . 307 (10): 588–96. doi : 10.1056 / NEJM198209023071004 . PMID 7110205 .