En estadística , la corrección de Yates para la continuidad (o la prueba de chi-cuadrado de Yates ) se usa en ciertas situaciones cuando se prueba la independencia en una tabla de contingencia . Tiene como objetivo corregir el error introducido asumiendo que las probabilidades discretas de frecuencias en la tabla se pueden aproximar mediante una distribución continua ( chi-cuadrado ). En algunos casos, la corrección de Yates puede ajustarse demasiado, por lo que su uso actual es limitado.
Corrección por error de aproximación
El uso de la distribución chi-cuadrado para interpretar el estadístico chi-cuadrado de Pearson requiere suponer que la probabilidad discreta de las frecuencias binomiales observadas en la tabla se puede aproximar mediante la distribución chi-cuadrado continua . Esta suposición no es del todo correcta e introduce algún error.
Para reducir el error en la aproximación, Frank Yates , un estadístico inglés , sugirió una corrección por continuidad que ajusta la fórmula para la prueba de chi-cuadrado de Pearson restando 0.5 de la diferencia entre cada valor observado y su valor esperado en una tabla de contingencia de 2 × 2. . [1] Esto reduce el valor de chi-cuadrado obtenido y, por lo tanto, aumenta su valor p .
El efecto de la corrección de Yates es evitar la sobreestimación de la significancia estadística para datos pequeños. Esta fórmula se usa principalmente cuando al menos una celda de la tabla tiene un recuento esperado menor que 5. Desafortunadamente, la corrección de Yates puede tender a sobrecorregir. Esto puede resultar en un resultado demasiado conservador que no rechaza la hipótesis nula cuando debería (un error de tipo II ). Por lo tanto, se sugiere que la corrección de Yates es innecesaria incluso con tamaños de muestra bastante bajos, [2] como:
La siguiente es la versión corregida de Yates de las estadísticas chi-cuadrado de Pearson :
dónde:
- O i = una frecuencia observada
- E i = una frecuencia esperada (teórica), afirmada por la hipótesis nula
- N = número de eventos distintos
Mesa 2 × 2
Como atajo, para una tabla de 2 × 2 con las siguientes entradas:
S | F | ||
---|---|---|---|
A | a | B | a + b |
B | C | D | c + d |
a + c | b + d | norte |
podemos escribir N = a + b + c + d
En algunos casos, esto es mejor.
Ver también
Referencias
- ↑ Yates, F (1934). "Tabla de contingencia que involucra números pequeños y laprueba deχ 2 ". Suplemento de la Revista de la Royal Statistical Society 1 (2): 217-235. JSTOR 2983604
- ^ Sokal RR, Rohlf FJ (1981). Biometría: los principios y la práctica de la estadística en la investigación biológica. Oxford: WH Freeman, ISBN 0-7167-1254-7 .