La detección de interacción automática de chi-cuadrado ( CHAID ) es una técnica de árbol de decisión , basada en pruebas de significancia ajustadas ( prueba de Bonferroni ). La técnica fue desarrollada en Sudáfrica y publicada en 1980 por Gordon V. Kass, quien había completado una tesis doctoral sobre este tema. CHAID se puede utilizar para la predicción (de forma similar al análisis de regresión(esta versión de CHAID se conocía originalmente como XAID), así como para la clasificación y para la detección de interacción entre variables. CHAID se basa en una extensión formal de los procedimientos AID (Automatic Interaction Detection) y THAID (THeta Automatic Interaction Detection) de los años 60 y 70 de los Estados Unidos, que a su vez fueron extensiones de investigaciones anteriores, incluida la realizada en el Reino Unido en el Reino Unido. 1950.
En la práctica, CHAID se usa a menudo en el contexto del marketing directo para seleccionar grupos de consumidores y predecir cómo sus respuestas a algunas variables afectan a otras variables, aunque otras aplicaciones tempranas fueron en el campo de la investigación médica y psiquiátrica.
Al igual que otros árboles de decisión, las ventajas de CHAID son que su salida es muy visual y fácil de interpretar. Debido a que utiliza divisiones de múltiples vías de forma predeterminada, necesita tamaños de muestra bastante grandes para funcionar de manera efectiva, ya que con tamaños de muestra pequeños, los grupos de encuestados pueden volverse demasiado pequeños para un análisis confiable.
Una ventaja importante de CHAID sobre alternativas como la regresión múltiple es que no es paramétrico.
Ver también
- Distribución chi-cuadrado
- Modelo de clase latente
- Modelos de ecuaciones estructurales
- Segmento de mercado
- Aprendizaje del árbol de decisiones
- Varias comparaciones
Referencias
Otras lecturas
- Belson, William A .; Emparejamiento y predicción sobre el principio de clasificación biológica , Estadística aplicada, vol. 8 (1959), págs. 65–75
- Morgan, John A .; Y Sonquist, James N .; Problemas en el análisis de datos de encuestas y una propuesta , Revista de la Asociación Estadounidense de Estadística , vol. 58 (1963), págs. 415–434
- Prensa, Laurence I .; Rogers, Miles S .; Y Shure, Gerald H .; Una técnica interactiva para el análisis de datos multivariados , Behavioral Science, Vol. 14 (1969), págs. 364–370
- Kass, Gordon V .; Una técnica exploratoria para investigar grandes cantidades de datos categóricos , Estadística aplicada, vol. 29, núm. 2 (1980), págs. 119-127
- Hawkins, Douglas M.; y Kass, Gordon V .; Detección automática de interacciones , en Hawkins, Douglas M. (ed), Topics in Applied Multivariate Analysis , Cambridge University Press, Cambridge, 1982, págs. 269–302
- Hooton, Thomas M .; Haley, Robert W .; Culver, David H .; White, John W .; Morgan, W. Meade; Y Carroll, Raymond J .; Las asociaciones conjuntas de múltiples factores de riesgo con la aparición de infecciones nosocomiales , American Journal of Medicine, vol. 70, (1981), págs. 960–970
- Brink, Susanne; Y Van Schalkwyk, Dirk J .; Ferritina sérica y volumen corpuscular medio como predictores de las reservas de hierro en la médula ósea , South African Medical Journal, vol. 61, (1982), págs. 432–434
- McKenzie, Dean P .; McGorry, Patrick D .; Wallace, Chris S .; Bajo, Lee H .; Copolov, David L .; Y Singh, Bruce S .; Construcción de un árbol de decisión de diagnóstico mínimo , Métodos de información en medicina, vol. 32 (1993), págs. 161-166
- Magidson, Jay; El enfoque CHAID para el modelado de segmentación: detección automática de interacción chi-cuadrado , en Bagozzi, Richard P. (ed); Métodos avanzados de investigación de mercados, Blackwell, Oxford, GB, 1994, págs. 118-159
- Hawkins, Douglas M .; Young, SS; Y Rosinko, A .; Análisis de un gran conjunto de datos estructura-actividad utilizando particiones recursivas , Relaciones cuantitativas estructura-actividad, vol. 16, (1997), págs. 296-302
Fuentes
- Luchman, JN; CHAID: módulo de Stata para realizar la detección de interacción automatizada chi-cuadrado , disponible para descarga gratuita , o escriba dentro de Stata: ssc install chaid.
- Luchman, JN; CHAIDFOREST: módulo de Stata para realizar una clasificación aleatoria de conjuntos de bosques basada en la detección de interacción automatizada chi-cuadrado (CHAID) como alumno base , disponible para descarga gratuita o escribir en Stata: ssc install chaidforest.