Relaciones entre distribuciones de probabilidad

En la teoría de la probabilidad y la estadística , existen varias relaciones entre las distribuciones de probabilidad . Estas relaciones se pueden clasificar en los siguientes grupos:

Una distribución es un caso especial de otra con un espacio de parámetros más amplio
Transforma (función de una variable aleatoria);
Combinaciones (función de varias variables);
Relaciones de aproximación (límite);
Relaciones compuestas (útil para la inferencia bayesiana);
Dualidad ^{[ aclaración necesaria ]} ;
A priori conjugados .

Las relaciones entre algunas de las distribuciones de probabilidad univariadas se ilustran con líneas conectadas. las líneas discontinuas significan una relación aproximada. más información: ^[1] Nota: La transformación de N (mu, sigma ^ 2) a N (0, 1) debe ser (X - mu) / sigma, no (X - mu) / sigma ^ 2

Relaciones entre distribuciones de probabilidad univariadas en ProbOnto . ^[2]

Caso especial de parametrización de distribución

Una variable aleatoria binomial ( n , p ) con n = 1, es una variable aleatoria de Bernoulli ( p ).
Una distribución binomial negativa con n = 1 es una distribución geométrica .
Una distribución gamma con parámetro de forma α = 1 y parámetro de escala θ es una distribución exponencial con valor esperado θ .
Una variable aleatoria gamma ( α , β ) con α = ν / 2 y β = 1/2, es una variable aleatoria de chi-cuadrado con ν grados de libertad .
Una distribución chi-cuadrado con 2 grados de libertad es una distribución exponencial con media 2 y viceversa.
Una variable aleatoria de Weibull (1, β ) es una variable aleatoria exponencial con una media de β .
Una variable aleatoria beta con parámetros α = β = 1 es una variable aleatoria uniforme .
Una variable aleatoria beta-binomial ( n , 1, 1) es una variable aleatoria uniforme discreta sobre los valores 0, ..., n .
Una variable aleatoria con una distribución t con un grado de libertad es una variable aleatoria de Cauchy (0,1).
Cuando c = 1, la distribución de Burr tipo XII se convierte en la distribución de Pareto Tipo II (Lomax).

Transformar de una variable

Múltiplo de una variable aleatoria

Al multiplicar la variable por cualquier constante real positiva se obtiene una escala de la distribución original. Algunos son autorreplicantes, lo que significa que el escalado produce la misma familia de distribuciones, aunque con un parámetro diferente: distribución normal , distribución gamma , distribución de Cauchy , distribución exponencial , distribución de Erlang , distribución de Weibull , distribución logística , distribución de error , ley de potencias. distribución , distribución de Rayleigh .

Ejemplo:

Si X es una variable aleatoria gamma con parámetros de forma y velocidad ( r , λ ), entonces Y = aX es una variable aleatoria gamma con parámetros ( r , λ / a ).

Si X es una variable aleatoria gamma con parámetros de forma y escala ( α , β ), entonces Y = aX es una variable aleatoria gamma con parámetros ( α , aβ ).

Función lineal de una variable aleatoria

La transformada afín ax + b produce una reubicación y una escala de la distribución original. Los siguientes son autorreplicantes: distribución normal , distribución de Cauchy , distribución logística , distribución de errores , distribución de potencia , distribución de Rayleigh .

Ejemplo:

Si Z es una variable aleatoria normal con parámetros ( μ = m , σ ² = s ² ), entonces X = aZ + b es una variable aleatoria normal con parámetros ( μ = am + b , σ ² = a ²s ² ).

Recíproco de una variable aleatoria

El recíproco 1 / X de una variable aleatoria X , es miembro de la misma familia de distribución que X , en los siguientes casos: distribución de Cauchy , distribución F , distribución log logística .

Ejemplos:

Si X es una variable aleatoria de Cauchy ( μ , σ ), entonces 1 / X es una variable aleatoria de Cauchy ( μ / C , σ / C ) donde C = μ ² + σ ² .
Si X es una variable aleatoria F ( ν ₁ , ν ₂ ), entonces 1 / X es una variable aleatoria F ( ν ₂ , ν ₁ ).

Otros casos

Algunas distribuciones son invariantes bajo una transformación específica.

Ejemplo:

Si X es una variable aleatoria beta ( α , β ), entonces (1 - X ) es una variable aleatoria beta ( β , α ).
Si X es una variable aleatoria binomial ( n , p ), entonces ( n - X ) es una variable aleatoria binomial ( n , 1 - p ).
Si X tiene una función de distribución acumulada F _X , entonces la inversa de la distribución acumulada F
_X( X ) es una variable aleatoria uniforme estándar (0,1)
Si X es un normales ( μ , sigma ² ) variable aleatoria entonces e ^X es un lognormal ( μ , σ ² ) variable aleatoria.

A la inversa, si X es un lognormal ( μ , sigma ² ) variable aleatoria continuación, iniciar sesión X es un normal ( μ , σ ² ) variable aleatoria.

Si X es una variable aleatoria exponencial con media β , entonces X ^{1 / γ} es una variable aleatoria de Weibull ( γ , β ).
El cuadrado de una variable aleatoria normal estándar tiene una distribución de chi cuadrado con un grado de libertad.
Si X es una variable aleatoria t de Student con ν grado de libertad, entonces X ² es una variable aleatoria F (1, ν ).
Si X es una variable aleatoria exponencial doble con media 0 y escala λ , entonces | X | es una variable aleatoria exponencial con media λ .
Una variable aleatoria geométrica es el piso de una variable aleatoria exponencial .
Una variable aleatoria rectangular es el piso de una variable aleatoria uniforme .
Una variable aleatoria recíproca es el exponencial de una variable aleatoria uniforme .

Funciones de varias variables

Suma de variables

La distribución de la suma de variables aleatorias independientes es la convolución de sus distribuciones. Suponer ${\ Displaystyle Z}$ es la suma de ${\ Displaystyle n}$ variables aleatorias independientes ${\ Displaystyle X_ {1}, \ dots, X_ {n}}$ cada uno con funciones de masa de probabilidad ${\ Displaystyle f_ {X_ {i}} (x)}$ . Luego

{\ Displaystyle Z = \ sum _ {i = 1} ^ {n} {X_ {i}}}

posee

Si tiene una distribución de la misma familia de distribuciones que las variables originales, se dice que esa familia de distribuciones está cerrada por convolución .

Ejemplos de tales distribuciones univariantes son: distribuciones normales , distribuciones de Poisson , distribuciones binomiales (con probabilidad de éxito común), distribución binomial negativa (con probabilidad de éxito común), distribuciones gamma (con común parámetro de velocidad ), las distribuciones de chi-cuadrado , distribuciones de Cauchy , hiperexponencial distribuciones .

Ejemplos: ^[3]^[4]

- Si X ₁ y X ₂ son variables aleatorias de Poisson con medias μ ₁ y μ ₂ respectivamente, entonces X ₁ + X ₂ es una variable aleatoria de Poisson con media μ ₁ + μ ₂ .
- La suma de las variables aleatorias gamma ( n _i , β ) tiene una distribución gamma (Σ n _i , β ).
- Si X ₁ es una variable aleatoria de Cauchy ( μ ₁ , σ ₁ ) y X ₂ es una Cauchy ( μ ₂ , σ ₂ ), entonces X ₁ + X ₂ es una Cauchy ( μ ₁ + μ ₂ , σ ₁ + σ ₂ ) variable aleatoria.
- Si X ₁ y X ₂ son variables aleatorias chi-cuadrado con ν ₁ y ν ₂ grados de libertad respectivamente, entonces X ₁ + X ₂ es una variable aleatoria chi-cuadrado con ν ₁ + ν ₂ grados de libertad.
- Si X ₁ es normal ( μ ₁ , σ²
  ₁) variable aleatoria y X ₂ es una normal ( μ ₂ , σ²
  ₂) variable aleatoria, entonces X ₁ + X ₂ es una normal ( μ ₁ + μ ₂ , σ²
  ₁+ σ²
  ₂) variable aleatoria.
- La suma de N variables aleatorias de chi-cuadrado (1) tiene una distribución de chi-cuadrado con N grados de libertad.

Otras distribuciones no están cerradas por convolución, pero su suma tiene una distribución conocida:

La suma de n variables aleatorias de Bernoulli (p) es una variable aleatoria binomial ( n , p ).
La suma de n geométricas variables aleatorias con probabilidad de éxito p es un binomial negativa variable aleatoria con los parámetros n y p .
La suma de n variables aleatorias exponenciales ( β ) es una variable aleatoria gamma ( n , β ).
- Si las variables aleatorias exponenciales tienen un parámetro de tasa común, su suma tiene una distribución de Erlang , un caso especial de distribución gamma.
La suma de los cuadrados de N variables aleatorias normales estándar tiene una distribución chi-cuadrado con N grados de libertad.

Producto de variables

El producto de las variables aleatorias independientes X e Y puede pertenecer a la misma familia de distribución que X e Y : distribución de Bernoulli y distribución logarítmica normal .

Ejemplo:

Si X ₁ y X ₂ son variables aleatorias log-normales independientes con parámetros ( μ ₁ , σ²
₁) y ( μ ₂ , σ²
₂) respectivamente, entonces X ₁ X ₂ es una variable aleatoria logarítmica normal con parámetros ( μ ₁ + μ ₂ , σ²
₁+ σ²
₂).

(Consulte también Distribución de productos ).

Mínimo y máximo de variables aleatorias independientes

Para algunas distribuciones, el mínimo valor de varias variables aleatorias independientes es un miembro de la misma familia, con diferentes parámetros: distribución de Bernoulli , distribución geométrica , distribución exponencial , distribución de valor extremo , distribución de Pareto , de distribución de Rayleigh , distribución de Weibull .

Ejemplos:

Si X ₁ y X ₂ son variables aleatorias geométricas independientes con probabilidad de éxito p ₁ y p ₂ respectivamente, entonces min ( X ₁ , X ₂ ) es una variable aleatoria geométrica con probabilidad de éxito p = p ₁ + p ₂ - p ₁ p ₂ . La relación es más simple si se expresa en términos de probabilidad de falla: q = q ₁ q ₂ .
Si X ₁ y X ₂ son variables aleatorias exponenciales independientes con tasa μ ₁ y μ ₂ respectivamente, entonces min ( X ₁ , X ₂ ) es una variable aleatoria exponencial con tasa μ = μ ₁ + μ ₂ .

De manera similar, las distribuciones para las que el valor máximo de varias variables aleatorias independientes es un miembro de la misma familia de distribución incluyen: distribución de Bernoulli , distribución de la ley de potencia .

Otro

Si X e Y son variables aleatorias normales estándar independientes , X / Y es una variable aleatoria de Cauchy (0,1).
Si X ₁ y X ₂ son variables aleatorias chi-cuadrado independientes con ν ₁ y ν ₂ grados de libertad respectivamente, entonces ( X ₁ / ν ₁ ) / ( X ₂ / ν ₂ ) es una F ( ν ₁ , ν ₂ ) variable aleatoria.
Si X es una variable aleatoria normal estándar y U es una variable aleatoria chi-cuadrado independiente con ν grados de libertad, entonces ${\ Displaystyle {\ frac {X} {\ sqrt {(U / \ nu)}}}}$ es una variable aleatoria t ( ν ) de Student .
Si X ₁ es una variable aleatoria gamma ( α ₁ , 1) y X ₂ es una variable aleatoria gamma (α ₂ , 1) independiente , entonces X ₁ / ( X ₁ + X ₂ ) es una beta ( α ₁ , α ₂ ) variable aleatoria. De manera más general, si X ₁ es una variable aleatoria gamma ( α ₁ , β ₁ ) y X ₂ es una variable aleatoria gamma ( α ₂ , β ₂ ) independiente , entonces β ₂ X ₁ / ( β ₂ X ₁ + β ₁ X ₂ ) es una variable aleatoria beta ( α ₁ , α ₂ ).
Si X e Y son variables aleatorias exponenciales independientes con media μ, entonces X - Y es una variable aleatoria exponencial doble con media 0 y escala μ.
Si X _i son variables aleatorias de Bernoulli independientes , entonces su paridad (XOR) es una variable de Bernoulli descrita por el lema de acumulación .

(Ver también distribución de razón ).

Relaciones aproximadas (límite)

Medios de relación aproximada o límite

o que la combinación de un número infinito de variables aleatorias iid tiende a alguna distribución,
o que el límite cuando un parámetro tiende a algún valor se acerca a una distribución diferente.

Combinación de variables aleatorias iid :

Dadas ciertas condiciones, la suma (de ahí el promedio) de un número suficientemente grande de variables aleatorias iid, cada una con media finita y varianza, tendrá una distribución aproximadamente normal. Este es el teorema del límite central (CLT).

Caso especial de parametrización de distribución:

X es una variable aleatoria hipergeométrica ( m , N , n ). Si n y m son grandes en comparación con N , y p = m / N no está cerca de 0 o 1, entonces X aproximadamente tiene una Binomial ( n , p distribución).
X es una variable aleatoria beta-binomial con parámetros ( n , α , β ). Sea p = α / ( α + β ) y suponga que α + β es grande, entonces X tiene aproximadamente una distribución binomial ( n , p ).
Si X es una variable aleatoria binomial ( n , p ) y si n es grande y np es pequeño, entonces X aproximadamente tiene una distribución de Poisson ( np ).
Si X es una variable aleatoria binomial negativa con r grande, P cerca de 1 y r (1 - P ) = λ , entonces X aproximadamente tiene una distribución de Poisson con media λ .

Consecuencias del CLT:

Si X es una variable aleatoria de Poisson con una media grande, entonces para los números enteros j y k , P ( j ≤ X ≤ k ) aproximadamente es igual a P ( j - 1/2 ≤ Y ≤ k + 1/2) donde Y es un valor normal distribución con la misma media y varianza como X .
Si X es una binomial ( n , p ) variable aleatoria con gran np y n (1 - p ), entonces para enteros j y k , P ( j ≤ X ≤ k ) es aproximadamente igual a P ( j - 1/2 ≤ Y ≤ k + 1/2) donde Y es una variable aleatoria normal con la misma media y varianza que X , es decir, np y np (1 - p ).
Si X es una variable aleatoria beta con parámetros α y β iguales y grandes, entonces X aproximadamente tiene una distribución normal con la misma media y varianza, es decir, media α / ( α + β ) y varianza αβ / (( α + β ) ² ( α + β + 1)).
Si X es una variable aleatoria gamma ( α , β ) y el parámetro de forma α es grande en relación con el parámetro de escala β , entonces X aproximadamente tiene una variable aleatoria normal con la misma media y varianza.
Si X es una variable aleatoria t de Student con un gran número de grados de libertad ν, entonces X aproximadamente tiene una distribución normal estándar .
Si X es una variable aleatoria F ( ν , ω ) con ω grande, entonces νX se distribuye aproximadamente como una variable aleatoria chi-cuadrado con ν grados de libertad.

Relaciones compuestas (o bayesianas)

Cuando uno o más parámetros de una distribución son variables aleatorias, la distribución compuesta es la distribución marginal de la variable.

Ejemplos:

Si X | N es una variable aleatoria binomial ( N , p ), donde el parámetro N es una variable aleatoria con distribución binomial negativa ( m , r ), luego X se distribuye como un binomio negativo ( m , r / ( p + qr )) .
Si X | N es una variable aleatoria binomial ( N , p ), donde el parámetro N es una variable aleatoria con distribución de Poisson ( μ ), luego X se distribuye como Poisson ( μp ).
Si X | μ es una variable aleatoria de Poisson ( μ ) y el parámetro μ es una variable aleatoria con distribución gamma ( m , θ ) (donde θ es el parámetro de escala), entonces X se distribuye como un binomio negativo ( m , θ / (1 + θ )), a veces llamada distribución gamma-Poisson .

Algunas distribuciones se han denominado especialmente como compuestos: distribución beta-binomial , distribución beta-Pascal , distribución gamma-normal .

Ejemplos:

Si X es una variable aleatoria Binomial ( n , p ) y el parámetro p es una variable aleatoria con distribución beta ( α , β ), entonces X se distribuye como un Binomio Beta ( α , β , n ).
Si X es una variable aleatoria binomial negativa ( m , p ) y el parámetro p es una variable aleatoria con distribución beta ( α , β ), entonces X se distribuye como un Beta-Pascal ( α , β , m ).

Ver también

Teorema del límite central
Distribución de probabilidad compuesta

Referencias

^ LEEMIS, Lawrence M .; Jacquelyn T. MCQUESTON (febrero de 2008). "Relaciones de distribución univariante" (PDF) . Estadístico estadounidense . 62 (1): 45–53. doi : 10.1198 / 000313008x270448 .
^ Swat, MJ; Grenon, P; Wimalaratne, S (2016). "ProbOnto: ontología y base de conocimientos de distribuciones de probabilidad" . Bioinformática . 32 (17): 2719-21. doi : 10.1093 / bioinformatics / btw170 . PMC 5013898 . PMID 27153608 .
^ Cook, John D. "Diagrama de relaciones de distribución" .
^ Dinov, Ivo D .; Siegrist, Kyle; Pearl, Dennis; Kalinin, Alex; Christou, Nicolas (2015). "Distribución de probabilidad: una infraestructura computacional web para explorar las propiedades, interrelaciones y aplicaciones de distribuciones de probabilidad" . Estadística computacional . 594 (2): 249–271. doi : 10.1007 / s00180-015-0594-6 . PMC 4856044 . PMID 27158191 .

enlaces externos

Gráfico interactivo: Relaciones de distribución univariadas
ProbOnto - Ontología y base de conocimiento de distribuciones de probabilidad: ProbOnto
El proyecto Probability Distributome incluye calculadoras, simuladores, experimentos y navegadores para renovaciones interdistribucionales y metadatos de distribución .

[1] LEEMIS, Lawrence M .; Jacquelyn T. MCQUESTON (febrero de 2008). "Relaciones de distribución univariante" (PDF) . Estadístico estadounidense . 62 (1): 45–53. doi : 10.1198 / 000313008x270448 .

[2] Swat, MJ; Grenon, P; Wimalaratne, S (2016). "ProbOnto: ontología y base de conocimientos de distribuciones de probabilidad" . Bioinformática . 32 (17): 2719-21. doi : 10.1093 / bioinformatics / btw170 . PMC 5013898 . PMID 27153608 .

[3] Cook, John D. "Diagrama de relaciones de distribución" .

[4] Dinov, Ivo D .; Siegrist, Kyle; Pearl, Dennis; Kalinin, Alex; Christou, Nicolas (2015). "Distribución de probabilidad: una infraestructura computacional web para explorar las propiedades, interrelaciones y aplicaciones de distribuciones de probabilidad" . Estadística computacional . 594 (2): 249–271. doi : 10.1007 / s00180-015-0594-6 . PMC 4856044 . PMID 27158191 .

[1]