En estadística , la gamma de Goodman y Kruskal es una medida de correlación de rango , es decir, la similitud de los ordenamientos de los datos cuando se clasifican por cada una de las cantidades. Mide la fuerza de asociación de los datos de tabulación cruzada cuando ambas variables se miden a nivel ordinal . No hace ningún ajuste ni para el tamaño de la mesa ni para las ataduras. Los valores van de -1 (asociación negativa del 100% o inversión perfecta) a +1 (asociación positiva del 100% o concordancia perfecta). Un valor de cero indica la ausencia de asociación.
Esta estadística (que es distinta de la lambda de Goodman y Kruskal ) lleva el nombre de Leo Goodman y William Kruskal , quienes la propusieron en una serie de artículos de 1954 a 1972. [1] [2] [3] [4]
Definición
La estimación de gamma, G , depende de dos cantidades:
- N s , el número de pares de casos clasificados en el mismo orden en ambas variables (número de pares concordantes ),
- N d , el número de pares de casos clasificados en orden inverso en ambas variables (número de pares invertidos),
donde se eliminan los "empates" (casos en los que cualquiera de las dos variables del par es igual). Luego
Este estadístico puede considerarse como el estimador de máxima verosimilitud para la cantidad teórica, dónde
y donde P s y P d son las probabilidades de que un par de observaciones seleccionadas al azar coloquen en el mismo orden o en el opuesto respectivamente, cuando se clasifiquen por ambas variables.
Los valores críticos para el estadístico gamma a veces se encuentran usando una aproximación, en la que un valor transformado, t del estadístico se refiere a la distribución t de Student , donde [ cita requerida ]
y donde n es el número de observaciones (no el número de pares):
Q de Yule
Un caso especial de la gamma de Goodman y Kruskal es la Q de Yule , también conocida como el coeficiente de asociación de Yule , [5] que es específico de las matrices 2 × 2. Considere la siguiente tabla de contingencia de eventos, donde cada valor es un recuento de la frecuencia de un evento:
sí | No | Totales | |
---|---|---|---|
Positivo | a | B | a + b |
Negativo | C | D | c + d |
Totales | a + c | b + d | norte |
La Q de Yule viene dada por:
Aunque se calcula de la misma manera que la gamma de Goodman y Kruskal, tiene una interpretación ligeramente más amplia porque la distinción entre escalas nominales y ordinales se convierte en una cuestión de etiquetado arbitrario para distinciones dicotómicas. Por lo tanto, si Q es positivo o negativo depende simplemente de qué emparejamientos el analista considera concordantes, pero por lo demás es simétrico.
Q varía de -1 a +1. −1 refleja una asociación negativa total, +1 refleja una asociación positiva perfecta y 0 no refleja ninguna asociación. El signo depende de qué emparejamientos el analista consideró inicialmente como concordantes, pero esta elección no afecta la magnitud.
En términos de la razón de posibilidades O, la Q de Yule viene dada por
y así la Q de Yule y la Y de Yule están relacionadas por
Ver también
Referencias
- ^ Goodman, Leo A .; Kruskal, William H. (1954). "Medidas de Asociación para Clasificaciones Cruzadas". Revista de la Asociación Estadounidense de Estadística . 49 (268): 732–764. doi : 10.2307 / 2281536 . JSTOR 2281536 .
- ^ Goodman, Leo A .; Kruskal, William H. (1959). "Medidas de asociación para clasificaciones cruzadas. II: Discusión adicional y referencias". Revista de la Asociación Estadounidense de Estadística . 54 (285): 123–163. doi : 10.1080 / 01621459.1959.10501503 . JSTOR 2282143 .
- ^ Goodman, Leo A .; Kruskal, William H. (1963). "Medidas de asociación para clasificaciones cruzadas III: teoría del muestreo aproximado". Revista de la Asociación Estadounidense de Estadística . 58 (302): 310–364. doi : 10.1080 / 01621459.1963.10500850 . JSTOR 2283271 .
- ^ Goodman, Leo A .; Kruskal, William H. (1972). "Medidas de asociación para clasificaciones cruzadas, IV: simplificación de variaciones asintóticas". Revista de la Asociación Estadounidense de Estadística . 67 (338): 415–421. doi : 10.1080 / 01621459.1972.10482401 . JSTOR 2284396 .
- ^ Yule, G U. (1912). "Sobre los métodos de medición de la asociación entre dos atributos" (PDF) . Revista de la Royal Statistical Society . 49 (6): 579–652. JSTOR 2340126 .
Otras lecturas
- Sheskin, DJ (2007) El manual de procedimientos estadísticos paramétricos y no paramétricos . Chapman y Hall / CRC, ISBN 9781584888147