En teoría de probabilidad y estadística , la lambda de Goodman & Kruskal () es una medida de reducción proporcional del error en el análisis de tabulación cruzada . Para cualquier muestra con una variable independiente nominal y una variable dependiente (o aquellas que puedan tratarse nominalmente), indica en qué medida las categorías modales y las frecuencias para cada valor de la variable independiente difieren de la categoría modal general y la frecuencia, es decir, para todos los valores de la variable independiente juntos. se puede calcular con la ecuación
dónde
- es la frecuencia no modal general, y
- es la suma de las frecuencias no modales para cada valor de la variable independiente.
Los valores de lambda van desde cero (sin asociación entre variables independientes y dependientes) a uno ( asociación perfecta ).
Debilidades
Aunque la lambda de Goodman y Kruskal es una forma sencilla de evaluar la asociación entre variables, arroja un valor de 0 (sin asociación) siempre que dos variables coincidan , es decir, cuando la categoría modal es la misma para todos los valores de la variable independiente. , incluso si las frecuencias modales o los porcentajes varían. Como ejemplo, considere la siguiente tabla, que describe una muestra ficticia de 350 personas, categorizadas por estado civil y presión arterial. Suponga que el estado de la relación es la variable independiente, la presión arterial es la variable dependiente, es decir, la pregunta es "¿se puede predecir mejor la presión arterial si se conoce el estado de la relación?"
estado civil | Total | |||
---|---|---|---|---|
Soltero | Casado | |||
Presión sanguínea | Normal | 80% (120) | 51% (102) | 63,4% (222) |
Elevado | 20% (30) | 49% (98) | 36,6% (128) | |
Total | 42,9% (150) | 57,1% (200) | 100% (350) |
Para esta muestra,
La razón es que la presión arterial nominal prevista es en realidad "Normal" en ambas columnas (ambos números superiores son más altos que el número inferior correspondiente). Por lo tanto, considerar el estado de la relación no cambiará la predicción de que las personas tienen una presión arterial normal, aunque los datos indican que estar casado aumenta la probabilidad de tener presión arterial alta.
Si se cambia la pregunta, por ejemplo, preguntando "¿Cuál es el estado de relación previsto según la presión arterial?" tendrá un valor distinto de cero.
Es decir:
Ver también
Referencias
- Goodman, LA, Kruskal, WH (1954) "Medidas de asociación para clasificaciones cruzadas" . Parte I. Revista de la Asociación Estadounidense de Estadística , 49, 732–764. JSTOR 281536
- Goodman, LA, Kruskal, WH (1959) "Medidas de asociación para clasificaciones cruzadas. II: Discusión adicional y referencias" [ enlace muerto permanente ] . Revista de la Asociación Estadounidense de Estadística , 52, 123-163. JSTOR 2282143
- Goodman, LA, Kruskal, WH (1963) "Medidas de asociación para clasificaciones cruzadas III: teoría de muestreo aproximada", Revista de la Asociación Estadounidense de Estadística , 58, 310-364. JSTOR 2283271 doi : 10.1080 / 01621459.1963.10500850