Fórmula de muestreo de Ewens


En genética de poblaciones , la fórmula de muestreo de Ewens describe las probabilidades asociadas con los recuentos de cuántos alelos diferentes se observan un número determinado de veces en la muestra .

Fórmula de muestreo de Ewens, introducido por Warren Ewens , los estados que bajo ciertas condiciones (especificados a continuación), si una muestra aleatoria de n gametos se toma de una población y clasificado de acuerdo con el gen en un determinado locus entonces la probabilidad de que hay un 1 alelos representados una vez en la muestra, y un 2 alelos representados dos veces, y así sucesivamente, es

para algún número positivo θ que representa la tasa de mutación de la población , siempre que a 1 , ..., a k es una secuencia de números enteros no negativos tal que

Ésta es una distribución de probabilidad en el conjunto de todas las particiones del entero n . Entre probabilistas y estadísticos, a menudo se la denomina distribución de Ewens multivariante .

Cuando θ  = 0, la probabilidad es 1 de que todos los n genes sean iguales. Cuando θ  = 1, entonces la distribución es precisamente la de la partición entera inducida por una permutación aleatoria distribuida uniformemente . Cuando θ  → ∞, la probabilidad de que dos de los n genes no sean iguales se aproxima a 1.

Esta familia de distribuciones de probabilidad disfruta de la propiedad de que si después de tomar la muestra de n , m de los n gametos se eligen sin reemplazo, entonces la distribución de probabilidad resultante en el conjunto de todas las particiones del entero más pequeño m es exactamente la fórmula anterior. daría si m se pusiera en lugar de  n .