En estadística , el coeficiente phi (o coeficiente de contingencia cuadrático medio y denotado por φ o r φ ) es una medida de asociación para dos variables binarias. Introducida por Karl Pearson , [1] esta medida es similar al coeficiente de correlación de Pearson en su interpretación. De hecho, un coeficiente de correlación de Pearson estimado para dos variables binarias devolverá el coeficiente phi. [2] El coeficiente phi está relacionado con la estadística de chi-cuadrado para una tabla de contingencia de 2 × 2 (consulte la prueba de chi-cuadrado de Pearson ) [3]
donde n es el número total de observaciones. Dos variables binarias se consideran asociadas positivamente si la mayoría de los datos caen a lo largo de las celdas diagonales. Por el contrario, dos variables binarias se consideran asociadas negativamente si la mayoría de los datos se salen de la diagonal. Si tenemos una tabla de 2 × 2 para dos variables aleatorias X y Y
y = 1 | y = 0 | total | |
x = 1 | |||
x = 0 | |||
total |
donde n 11 , n 10 , n 01 , n 00 , son recuentos no negativos de números de observaciones que suman n , el número total de observaciones. El coeficiente phi que describe la asociación de x y y es
Phi está relacionado con el coeficiente de correlación biserial puntual y la d de Cohen y estima el alcance de la relación entre dos variables (2 × 2). [4]
El coeficiente phi también se puede expresar usando solo , , , y , como
Valores máximos
Aunque computacionalmente el coeficiente de correlación de Pearson se reduce al coeficiente phi en el caso 2 × 2, en general no son iguales. El coeficiente de correlación de Pearson varía de -1 a +1, donde ± 1 indica un acuerdo o desacuerdo perfecto y 0 indica que no hay relación. El coeficiente phi tiene un valor máximo que está determinado por la distribución de las dos variables si una o ambas variables pueden tomar más de dos valores. [ se necesita más explicación ] Ver Davenport y El-Sanhury (1991) [5] para una discusión completa.
Ver también
- Mesa de contingencia
- Coeficiente de correlación de Matthews
- V de Cramér , una medida similar de asociación entre variables nominales.
- Correlación policórica (subtipo: correlación tetracorica), cuando las variables se ven como versiones dicotomizadas de variables continuas (latentes)
Referencias
- ^ Cramer, H. (1946). Métodos matemáticos de estadística . Princeton: Princeton University Press, pág. 282 (segundo párrafo). ISBN 0-691-08004-6
- ^ Guilford, J. (1936). Métodos psicométricos . Nueva York: McGraw – Hill Book Company, Inc.
- ^ Everitt BS (2002) El diccionario de estadística de Cambridge , CUP. ISBN 0-521-81099-X
- ^ Aaron, B., Kromrey, JD y Ferron, JM (1998, noviembre). Igualación de índices de tamaño del efecto basados en r y basados en d: problemas con una fórmula comúnmente recomendada. Trabajo presentado en la reunión anual de la Asociación de Investigación Educativa de Florida, Orlando, FL. (Servicio de reproducción de documentos ERIC No. ED433353)
- ^ Davenport, E. y El-Sanhury, N. (1991). Phi / Phimax: revisión y síntesis. Medición educativa y psicológica, 51, 821–828.