Prueba multinomial

En estadística , la prueba multinomial es la prueba de la hipótesis nula de que los parámetros de una distribución multinomial son iguales a valores especificados. Se utiliza para datos categóricos; ver Read y Cressie. ^[1]

Comenzando con una muestra de ${\ Displaystyle N}$ elementos, cada uno de los cuales se ha observado que cae en uno de los ${\ Displaystyle k}$ categorías. Es posible definir ${\ Displaystyle \ mathbf {x} = (x_ {1}, x_ {2}, \ dots, x_ {k})}$ como el número observado de elementos en cada celda. Por eso ${\ Displaystyle \ textstyle \ sum _ {i = 1} ^ {k} x_ {i} = N}$ .

A continuación, definiendo un vector de parámetros ${\ Displaystyle H_ {0}: \ mathbf {\ pi} = (\ pi _ {1}, \ pi _ {2}, \ dots, \ pi _ {k})}$ , dónde : ${\ Displaystyle \ textstyle \ sum _ {i = 1} ^ {k} \ pi _ {i} = 1}$ . Estos son los valores de los parámetros bajo la hipótesis nula .

La probabilidad exacta de la configuración observada ${\ Displaystyle \ mathbf {x}}$ bajo la hipótesis nula está dada por

{\ Displaystyle \ Pr (\ mathbf {x) _ {0}} = N! \ prod _ {i = 1} ^ {k} {\ frac {\ pi _ {i} ^ {x_ {i}}} { x_ {i}!}}.}

La probabilidad de significancia para la prueba es la probabilidad de ocurrencia del conjunto de datos observado, o de un conjunto de datos menos probable que el observado, si la hipótesis nula es verdadera. Usando una prueba exacta , esto se calcula como

{\ Displaystyle \ Pr (\ mathbf {sig}) = \ sum _ {y: Pr (\ mathbf {y}) \ leq Pr (\ mathbf {x) _ {0}}} \ Pr (\ mathbf {y} )}

donde la suma varía entre todos los resultados tan probables o menos probables que los observados. En la práctica, esto se vuelve computacionalmente oneroso a medida que ${\ Displaystyle k}$ y ${\ Displaystyle N}$ aumentar, por lo que probablemente solo valga la pena utilizar pruebas exactas para muestras pequeñas. Para muestras más grandes, las aproximaciones asintóticas son lo suficientemente precisas y fáciles de calcular.

Una de estas aproximaciones es la razón de verosimilitud . Se puede definir una hipótesis alternativa bajo la cual cada valor ${\ Displaystyle \ pi _ {i}}$ se reemplaza por su estimación de máxima verosimilitud ${\ Displaystyle p_ {i} = x_ {i} / N}$ . La probabilidad exacta de la configuración observada ${\ Displaystyle \ mathbf {x}}$ bajo la hipótesis alternativa está dada por

{\ Displaystyle \ Pr (\ mathbf {x) _ {A}} = N! \ prod _ {i = 1} ^ {k} {\ frac {p_ {i} ^ {x_ {i}}} {x_ { I}!}}.}

El logaritmo natural de la razón entre estas dos probabilidades multiplicado por ${\ displaystyle -2}$ es entonces el estadístico para la prueba de razón de verosimilitud

{\ Displaystyle -2 \ ln (L / R) = \ textstyle -2 \ sum _ {i = 1} ^ {k} x_ {i} \ ln (\ pi _ {i} / p_ {i}).}

^{[ aclaración necesaria ]}

Si la hipótesis nula es verdadera, entonces como ${\ Displaystyle N}$ aumenta, la distribución de ${\ Displaystyle -2 \ ln (LR)}$ converge a la de chi-cuadrado con ${\ Displaystyle k-1}$ grados de libertad. Sin embargo, se sabe desde hace mucho tiempo (por ejemplo, Lawley 1956) que para tamaños de muestra finitos, los momentos de ${\ Displaystyle -2 \ ln (LR)}$ son mayores que los de chi-cuadrado, lo que aumenta la probabilidad de errores de tipo I (falsos positivos). La diferencia entre los momentos de chi-cuadrado y los del estadístico de prueba son una función de ${\ Displaystyle N ^ {- 1}}$ . Williams (1976) demostró que el primer momento se puede igualar en la medida de lo posible. ${\ Displaystyle N ^ {- 2}}$ si la estadística de prueba se divide por un factor dado por

{\ Displaystyle q_ {1} = 1 + {\ frac {\ sum _ {i = 1} ^ {k} \ pi _ {i} ^ {- 1} -1} {6N (k-1)}}. }

En el caso especial donde la hipótesis nula es que todos los valores ${\ Displaystyle \ pi _ {i}}$ son iguales a ${\ Displaystyle 1 / k}$ (es decir, estipula una distribución uniforme), esto simplifica a

{\ Displaystyle q_ {1} = 1 + {\ frac {k + 1} {6N}}.}

Posteriormente, Smith et al. (1981) derivó un factor de división que coincide con el primer momento en cuanto a ${\ Displaystyle N ^ {- 3}}$ . Para el caso de valores iguales de ${\ Displaystyle \ pi _ {i}}$ , este factor es

{\ Displaystyle q_ {2} = 1 + {\ frac {k + 1} {6N}} + {\ frac {k ^ {2}} {6N ^ {2}}}.}

La hipótesis nula también se puede probar mediante la prueba de chi-cuadrado de Pearson

{\ Displaystyle \ chi ^ {2} = \ sum _ {i = 1} ^ {k} {(x_ {i} -E_ {i}) ^ {2} \ over E_ {i}}}

dónde ${\ Displaystyle E_ {i} = N \ pi _ {i}}$ es el número esperado de casos en la categoría ${\ Displaystyle i}$ bajo la hipótesis nula. Esta estadística también converge a una distribución chi-cuadrado con ${\ Displaystyle k-1}$ grados de libertad cuando la hipótesis nula es verdadera, pero lo hace desde abajo, por así decirlo, en lugar de desde arriba como ${\ Displaystyle -2 \ ln (LR)}$ lo hace, por lo que puede ser preferible a la versión sin corregir de ${\ Displaystyle -2 \ ln (LR)}$ para pequeñas muestras. ^{[ cita requerida ]}

Referencias

^ Leer, TRC y Cressie, NAC (1988). Estadísticas de bondad de ajuste para datos multivariados discretos. Nueva York: Springer-Verlag. ISBN 0-387-96682-X .

Lawley, DN (1956). "Un método general de aproximación a la distribución de criterios de razón de verosimilitud". Biometrika . 43 : 295-303. doi : 10.1093 / biomet / 43.3-4.295 .
Smith, PJ, Rae, DS, Manderscheid, RW y Silbergeld, S. (1981). "Aproximación de los momentos y la distribución de la estadística de razón de verosimilitud para la bondad de ajuste multinomial". Revista de la Asociación Estadounidense de Estadística . Asociación Estadounidense de Estadística. 76 (375): 737–740. doi : 10.2307 / 2287541 . JSTOR 2287541 .CS1 maint: varios nombres: lista de autores ( enlace )
Williams, DA (1976). "Pruebas de razón de verosimilitud mejoradas para tablas de contingencia completas". Biometrika . 63 : 33–37. doi : 10.1093 / biomet / 63.1.33 .

[1] Leer, TRC y Cressie, NAC (1988). Estadísticas de bondad de ajuste para datos multivariados discretos. Nueva York: Springer-Verlag. ISBN 0-387-96682-X .

[1]