Lambda de Goodman y Kruskal


En teoría de probabilidad y estadística , la lambda de Goodman & Kruskal ( ) es una medida de reducción proporcional del error en el análisis de tabulación cruzada . Para cualquier muestra con una variable independiente nominal y una variable dependiente (o aquellas que pueden tratarse nominalmente), indica hasta qué punto las categorías modales y las frecuencias para cada valor de la variable independiente difieren de la categoría modal y la frecuencia generales, es decir, para todos los valores de la variable independiente juntos. está definida por la ecuación

Los valores de lambda varían de cero (sin asociación entre las variables independientes y dependientes) a uno ( asociación perfecta ).

Aunque la lambda de Goodman y Kruskal es una forma sencilla de evaluar la asociación entre variables, arroja un valor de 0 (sin asociación) siempre que dos variables estén de acuerdo , es decir, cuando la categoría modal es la misma para todos los valores de la variable independiente. , aunque varíen las frecuencias modales o los porcentajes. Como ejemplo, considere la siguiente tabla, que describe una muestra ficticia de 350 personas, clasificadas por estado civil y presión arterial. Suponga que el estado civil es la variable independiente, la presión arterial es la variable dependiente, es decir, la pregunta que se hace es "¿se puede predecir mejor la presión arterial si se conoce el estado civil?"

La razón es que la presión arterial nominal predicha es en realidad "Normal" en ambas columnas (los dos números superiores son más altos que el número inferior correspondiente). Por lo tanto, considerar el estado civil no cambiará la predicción de que las personas tienen una presión arterial normal, aunque los datos indican que estar casado aumenta la probabilidad de tener presión arterial alta.

Si se cambia la pregunta, por ejemplo, preguntando "¿Cuál es el estado de la relación pronosticado en función de la presión arterial?" , tendrá un valor distinto de cero.