En teoría de probabilidad y estadística , la distribución beta-binomial es una familia de distribuciones de probabilidad discretas sobre un soporte finito de enteros no negativos que surgen cuando la probabilidad de éxito en cada uno de un número fijo o conocido de ensayos de Bernoulli es desconocida o aleatoria. La distribución binomial beta es la distribución binomial en la que la probabilidad de éxito en cada uno de los n ensayos no es fija, sino que se extrae aleatoriamente de una distribución beta . Se utiliza con frecuencia en estadísticas bayesianas , métodos empíricos de Bayes yestadística clásica para capturar la sobredispersión en datos distribuidos de tipo binomial.
Función de probabilidad |
Función de distribución acumulativa |
Parámetros | n ∈ N 0 - número de intentos ( real ) ( real ) |
---|
Apoyo | k ∈ {0,…, n } |
---|
PMF | |
---|
CDF |
donde 3 F 2 ( a , b , k) es la función hipergeométrica generalizada |
---|
Significar | |
---|
Diferencia | |
---|
Oblicuidad | |
---|
Ex. curtosis | Ver texto |
---|
MGF | dónde es la función hipergeométrica |
---|
CF |
|
---|
PGF |
|
---|
Se reduce a la distribución de Bernoulli como un caso especial cuando n = 1. Para α = β = 1, es la distribución uniforme discreta de 0 an . También se aproxima arbitrariamente bien a la distribución binomial para α y β grandes . De manera similar, contiene la distribución binomial negativa en el límite con β y n grandes . El binomio beta es una versión unidimensional de la distribución de Dirichlet-multinomial, ya que las distribuciones binomial y beta son versiones univariadas de las distribuciones multinomial y de Dirichlet, respectivamente.
El caso especial en el que α y β son números enteros también se conoce como distribución hipergeométrica negativa .
Motivación y derivaciónComo distribución compuesta
La distribución Beta es una distribución conjugada de la distribución binomial . Este hecho conduce a una distribución de compuestos analíticamente manejable donde uno puede pensar en laparámetro en la distribución binomial como extraído aleatoriamente de una distribución beta. Es decir, si
luego
donde Bin ( n , p ) representa la distribución binomial , y donde p es una variable aleatoria con una distribución beta .
entonces la distribución compuesta viene dada por
Usando las propiedades de la función beta , esto se puede escribir alternativamente
Beta-binomio como modelo de urna
La distribución beta-binomial también se puede motivar a través de un modelo de urna para valores enteros positivos de α y β , conocido como modelo de urna de Pólya . Específicamente, imagine una urna que contenga α bolas rojas y β bolas negras, donde se realizan sorteos aleatorios. Si se observa una bola roja, se devuelven dos bolas rojas a la urna. Del mismo modo, si se saca una bola negra, se devuelven dos bolas negras a la urna. Si esto se repite n veces, entonces la probabilidad de observar k bolas rojas sigue una distribución beta-binomial con parámetros n , α y β .
Si los sorteos aleatorios son con reemplazo simple (no se agregan a la urna bolas por encima de la bola observada), entonces la distribución sigue una distribución binomial y si los sorteos aleatorios se realizan sin reemplazo, la distribución sigue una distribución hipergeométrica .
Momentos y propiedadesLos primeros tres momentos crudos son
y la curtosis es
Dejando notamos, sugestivamente, que la media puede escribirse como
y la varianza como
dónde . El parámetrose conoce como correlación "intraclase" o "intragrupo". Es esta correlación positiva la que da lugar a una dispersión excesiva.
Estimaciones puntualesMétodo de momentos
El método de estimaciones de momentos se puede obtener observando el primer y segundo momento del binomio beta, a saber
y establecer estos momentos sin procesar iguales a los momentos de muestra sin procesar primero y segundo respectivamente
y despejando α y β obtenemos
Estas estimaciones pueden ser negativas sin sentido, lo que es evidencia de que los datos no están dispersos o no están dispersos en relación con la distribución binomial. En este caso, la distribución binomial y la distribución hipergeométrica son candidatos alternativos respectivamente.
Estimación de máxima verosimilitud
Si bien las estimaciones de máxima verosimilitud en forma cerrada no son prácticas, dado que el pdf consta de funciones comunes (función gamma y / o funciones Beta), se pueden encontrar fácilmente a través de la optimización numérica directa. Las estimaciones de máxima verosimilitud a partir de datos empíricos se pueden calcular utilizando métodos generales para ajustar distribuciones de Pólya multinomiales, métodos para los cuales se describen en (Minka 2003). El paquete R VGAM a través de la función vglm, vía máxima verosimilitud, facilita el ajuste de modelos de tipo glm con respuestas distribuidas según la distribución binomial beta. No es necesario que n sea fijo en todas las observaciones.
Ejemplo
Los siguientes datos dan el número de hijos varones entre los primeros 12 hijos del tamaño de la familia 13 en 6115 familias extraídas de los registros de hospitales en el siglo XIX en Sajonia (Sokal y Rohlf, p. 59 de Lindsey). El decimotercer hijo se ignora para mitigar el efecto de que las familias se detengan de forma no aleatoria cuando se alcanza el sexo deseado.
Machos | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 |
Familias | 3 | 24 | 104 | 286 | 670 | 1033 | 1343 | 1112 | 829 | 478 | 181 | 45 | 7 |
Los dos primeros momentos de muestra son
y por lo tanto el método de estimaciones de momentos es
Las estimaciones de máxima verosimilitud se pueden encontrar numéricamente
y la probabilidad logarítmica maximizada es
de donde encontramos el AIC
El AIC para el modelo binomial competidor es AIC = 25070.34 y, por lo tanto, vemos que el modelo beta-binomial proporciona un ajuste superior a los datos, es decir, hay evidencia de sobredispersión. Trivers y Willard postulan una justificación teórica para la heterogeneidad (también conocida como " explosión ") en la propensión al género entre la descendencia de mamíferos (es decir, sobredispersión).
El ajuste superior es evidente especialmente entre las colas.
Machos | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 |
Familias observadas | 3 | 24 | 104 | 286 | 670 | 1033 | 1343 | 1112 | 829 | 478 | 181 | 45 | 7 |
Ajustado esperado (beta-binomial) | 2.3 | 22,6 | 104,8 | 310,9 | 655,7 | 1036.2 | 1257,9 | 1182.1 | 853,6 | 461,9 | 177,9 | 43,8 | 5.2 |
Ajustado esperado (binomio p = 0,519215) | 0,9 | 12,1 | 71,8 | 258,5 | 628,1 | 1085,2 | 1367.3 | 1265.6 | 854,2 | 410,0 | 132,8 | 26,1 | 2.3 |
Otras consideraciones bayesianasEs conveniente volver a parametrizar las distribuciones para que la media esperada de la anterior sea un solo parámetro: Sea
dónde
así que eso
La distribución posterior ρ ( θ | k ) también es una distribución beta:
Y
mientras que la distribución marginal m ( k | μ , M ) viene dada por
Sustituyendo de nuevo M y μ, en términos de y , esto se convierte en:
cuál es la distribución beta-binomial esperada con parámetros y .
También podemos usar el método de expectativas iteradas para encontrar el valor esperado de los momentos marginales. Escribamos nuestro modelo como un modelo de muestreo compuesto de dos etapas. Sea k i el número de éxito de n i ensayos para el evento i :
Podemos encontrar estimaciones de momentos iterados para la media y la varianza utilizando los momentos para las distribuciones en el modelo de dos etapas:
(Aquí hemos utilizado la ley de la expectativa total y la ley de la varianza total ).
Queremos estimaciones puntuales para y . La media estimada se calcula a partir de la muestra
La estimación del hiperparámetro M se obtiene utilizando las estimaciones de momento para la varianza del modelo de dos etapas:
Resolviendo:
dónde
Dado que ahora tenemos estimaciones puntuales de parámetros, y , para la distribución subyacente, nos gustaría encontrar una estimación puntual para la probabilidad de éxito del evento i . Este es el promedio ponderado de la estimación del evento. y . Dadas nuestras estimaciones puntuales para el anterior, ahora podemos conectar estos valores para encontrar una estimación puntual para el posterior
Factores de contracciónPodemos escribir la estimación posterior como un promedio ponderado:
dónde se llama factor de contracción .
Distribuciones relacionadas- dónde es la distribución uniforme discreta .
Ver también- Distribución de Dirichlet-multinomial
Referencias- Minka, Thomas P. (2003). Estimación de una distribución de Dirichlet . Informe técnico de Microsoft.
enlaces externos- Uso de la distribución beta-binomial para evaluar el rendimiento de un dispositivo de identificación biométrica
- Fastfit contiene código Matlab para ajustar distribuciones Beta-Binomial (en forma de distribuciones Pólya bidimensionales) a los datos.
- Gráfico interactivo: Relaciones de distribución univariadas
- Funciones beta-binomiales en el paquete VGAM R
- Distribución beta-binomial en la biblioteca Java de Sandia National Labs Cognitive Foundry