Distribución hipergeométrica no central de Fisher

En teoría de probabilidad y estadística , la distribución hipergeométrica no central de Fisher es una generalización de la distribución hipergeométrica donde las probabilidades de muestreo se modifican por factores de peso. También se puede definir como la distribución condicional de dos o más variables distribuidas binomialmente que dependen de su suma fija.

La distribución puede ilustrarse con el siguiente modelo de urna . Supongamos, por ejemplo, que una urna contiene m ₁ bolas rojas y m ₂ bolas blancas, totalizando N = m ₁ + m ₂ bolas. Cada bola roja tiene el peso ω ₁ y cada bola blanca tiene el peso ω ₂ . Diremos que la razón de posibilidades es ω = ω ₁ / ω ₂ . Ahora estamos tomando bolas al azar de tal manera que la probabilidad de tomar una bola en particular es proporcional a su peso, pero independiente de lo que les suceda a las otras bolas. El número de bolas tomadas de un color particular sigue eldistribución binomial . Si se conoce el número total n de bolas extraídas, entonces la distribución condicional del número de bolas rojas extraídas para n dado es la distribución hipergeométrica no central de Fisher. Para generar esta distribución experimentalmente, tenemos que repetir el experimento hasta que dé n bolas.

Si queremos fijar el valor de n antes del experimento, tenemos que ir tomando las bolas una por una hasta tener n bolas. Por lo tanto, las bolas ya no son independientes. Esto da una distribución ligeramente diferente conocida como distribución hipergeométrica no central de Wallenius . Está lejos de ser obvio por qué estas dos distribuciones son diferentes. Consulte la entrada para distribuciones hipergeométricas no centrales para obtener una explicación de la diferencia entre estas dos distribuciones y una discusión sobre qué distribución usar en diversas situaciones.

Las dos distribuciones son ambas iguales a la distribución hipergeométrica (central) cuando la razón de probabilidad es 1.

Desafortunadamente, ambas distribuciones son conocidas en la literatura como "la" distribución hipergeométrica no central. Es importante ser específico sobre a qué distribución se refiere cuando se usa este nombre.

La distribución hipergeométrica no central de Fisher recibió por primera vez el nombre de distribución hipergeométrica extendida (Harkness, 1965), y algunos autores todavía usan este nombre en la actualidad.

Función de masa de probabilidad para la distribución hipergeométrica no central de Fisher para diferentes valores de la razón de posibilidades ω.
m ₁ = 80, m ₂ = 60, n = 100, ω = 0,01, ..., 1000

Biólogo y estadístico Ronald Fisher