Suma de variables aleatorias distribuidas normalmente

En la teoría de la probabilidad , el cálculo de la suma de las variables aleatorias distribuidas normalmente es una instancia de la aritmética de las variables aleatorias , que puede ser bastante compleja en función de las distribuciones de probabilidad de las variables aleatorias involucradas y sus relaciones.

Esto no debe confundirse con la suma de distribuciones normales que forma una distribución de mezcla .

Variables aleatorias independientes

Deje que X y Y sean independientes variables aleatorias que se distribuyen normalmente (y por tanto también de forma conjunta de modo), entonces su suma es también normalmente distribuidos. es decir, si

{\ Displaystyle X \ sim N (\ mu _ {X}, \ sigma _ {X} ^ {2})}

{\ Displaystyle Y \ sim N (\ mu _ {Y}, \ sigma _ {Y} ^ {2})}

{\ Displaystyle Z = X + Y,}

luego

{\ Displaystyle Z \ sim N (\ mu _ {X} + \ mu _ {Y}, \ sigma _ {X} ^ {2} + \ sigma _ {Y} ^ {2}).}

Esto significa que la suma de dos variables aleatorias independientes distribuidas normalmente es normal, siendo su media la suma de las dos medias y su varianza la suma de las dos varianzas (es decir, el cuadrado de la desviación estándar es la suma de las cuadrados de las desviaciones estándar). ^[1]

Para que este resultado se mantenga, la suposición de que X e Y son independientes no puede descartarse, aunque puede debilitarse a la suposición de que X e Y están distribuidas normalmente de forma conjunta , en lugar de por separado. ^[2] (Vea aquí un ejemplo ).

El resultado de la media se mantiene en todos los casos, mientras que el resultado de la varianza requiere falta de correlación, pero no independencia.

Pruebas

Prueba usando funciones características

La función característica

{\ Displaystyle \ varphi _ {X + Y} (t) = \ operatorname {E} \ left (e ^ {it (X + Y)} \ right)}

de la suma de dos variables aleatorias independientes X e Y es solo el producto de las dos funciones características separadas:

{\ Displaystyle \ varphi _ {X} (t) = \ operatorname {E} \ left (e ^ {itX} \ right), \ qquad \ varphi _ {Y} (t) = \ operatorname {E} \ left ( e ^ {itY} \ right)}

de X y Y .

La función característica de la distribución normal con valor esperado μ y varianza σ ² es

{\ Displaystyle \ varphi (t) = \ exp \ left (it \ mu - {\ sigma ^ {2} t ^ {2} \ over 2} \ right).}

Entonces

{\ Displaystyle {\ begin {alineado} \ varphi _ {X + Y} (t) = \ varphi _ {X} (t) \ varphi _ {Y} (t) & = \ exp \ left (it \ mu _ {X} - {\ sigma _ {X} ^ {2} t ^ {2} \ over 2} \ right) \ exp \ left (it \ mu _ {Y} - {\ sigma _ {Y} ^ {2 } t ^ {2} \ over 2} \ right) \\ [6pt] & = \ exp \ left (it (\ mu _ {X} + \ mu _ {Y}) - {(\ sigma _ {X} ^ {2} + \ sigma _ {Y} ^ {2}) t ^ {2} \ over 2} \ right). \ End {alineado}}}

Esta es la función característica de la distribución normal con valor esperado ${\ Displaystyle \ mu _ {X} + \ mu _ {Y}}$ y varianza ${\ Displaystyle \ sigma _ {X} ^ {2} + \ sigma _ {Y} ^ {2}}$

Finalmente, recuerde que no hay dos distribuciones distintas que puedan tener la misma función característica, por lo que la distribución de X + Y debe ser solo esta distribución normal.

Prueba mediante convoluciones

Para las variables aleatorias independientes X e Y , la distribución f _Z de Z = X + Y es igual a la convolución de f _X y f _Y :

{\ Displaystyle f_ {Z} (z) = \ int _ {- \ infty} ^ {\ infty} f_ {Y} (zx) f_ {X} (x) \, dx}

Dado que f _X y f _Y son densidades normales,

{\ Displaystyle {\ begin {alineado} f_ {X} (x) = {\ mathcal {N}} (x; \ mu _ {X}, \ sigma _ {X} ^ {2}) = {\ frac { 1} {{\ sqrt {2 \ pi}} \ sigma _ {X}}} e ^ {- (x- \ mu _ {X}) ^ {2} / (2 \ sigma _ {X} ^ {2 })} \\ [5pt] f_ {Y} (y) = {\ mathcal {N}} (y; \ mu _ {Y}, \ sigma _ {Y} ^ {2}) = {\ frac {1 } {{\ sqrt {2 \ pi}} \ sigma _ {Y}}} e ^ {- (y- \ mu _ {Y}) ^ {2} / (2 \ sigma _ {Y} ^ {2} )} \ end {alineado}}}

Sustituyendo en la convolución:

{\ Displaystyle {\ begin {alineado} f_ {Z} (z) & = \ int _ {- \ infty} ^ {\ infty} {\ frac {1} {{\ sqrt {2 \ pi}} \ sigma _ {Y}}} \ exp \ left [- {(zx- \ mu _ {Y}) ^ {2} \ over 2 \ sigma _ {Y} ^ {2}} \ right] {\ frac {1} { {\ sqrt {2 \ pi}} \ sigma _ {X}}} \ exp \ left [- {(x- \ mu _ {X}) ^ {2} \ over 2 \ sigma _ {X} ^ {2 }} \ derecha] \, dx \\ [6pt] & = \ int _ {- \ infty} ^ {\ infty} {\ frac {1} {{\ sqrt {2 \ pi}} {\ sqrt {2 \ pi}} \ sigma _ {X} \ sigma _ {Y}}} \ exp \ left [- {\ frac {\ sigma _ {X} ^ {2} (zx- \ mu _ {Y}) ^ {2 } + \ sigma _ {Y} ^ {2} (x- \ mu _ {X}) ^ {2}} {2 \ sigma _ {X} ^ {2} \ sigma _ {Y} ^ {2}} } \ right] \, dx \\ [6pt] & = \ int _ {- \ infty} ^ {\ infty} {\ frac {1} {{\ sqrt {2 \ pi}} {\ sqrt {2 \ pi }} \ sigma _ {X} \ sigma _ {Y}}} \ exp \ left [- {\ frac {\ sigma _ {X} ^ {2} (z ^ {2} + x ^ {2} + \ mu _ {Y} ^ {2} -2xz-2z \ mu _ {Y} + 2x \ mu _ {Y}) + \ sigma _ {Y} ^ {2} (x ^ {2} + \ mu _ { X} ^ {2} -2x \ mu _ {X})} {2 \ sigma _ {Y} ^ {2} \ sigma _ {X} ^ {2}}} \ right] \, dx \\ [6pt ] & = \ int _ {- \ infty} ^ {\ infty} {\ frac {1} {{\ sqrt {2 \ pi}} {\ sqrt {2 \ pi}} \ sigma _ {X} \ sigma _ {Y}}} \ exp \ left [- {\ frac {x ^ {2} (\ sigma _ {X} ^ {2} + \ sigma _ {Y} ^ {2}) - 2x (\ sigma _ { X} ^ {2} (z- \ mu _ {Y}) + \ sigma _ {Y} ^ {2} \ mu _ {X}) + \ sigm a _ {X} ^ {2} (z ^ {2} + \ mu _ {Y} ^ {2} -2z \ mu _ {Y}) + \ sigma _ {Y} ^ {2} \ mu _ { X} ^ {2}} {2 \ sigma _ {Y} ^ {2} \ sigma _ {X} ^ {2}}} \ right] \, dx \\ [6pt] \ end {alineado}}}

Definiendo ${\ Displaystyle \ sigma _ {Z} = {\ sqrt {\ sigma _ {X} ^ {2} + \ sigma _ {Y} ^ {2}}}}$ , y completando el cuadrado :

{\ Displaystyle {\ begin {alineado} f_ {Z} (z) & = \ int _ {- \ infty} ^ {\ infty} {\ frac {1} {{\ sqrt {2 \ pi}} \ sigma _ {Z}}} {\ frac {1} {{\ sqrt {2 \ pi}} {\ frac {\ sigma _ {X} \ sigma _ {Y}} {\ sigma _ {Z}}}}} \ exp \ left [- {\ frac {x ^ {2} -2x {\ frac {\ sigma _ {X} ^ {2} (z- \ mu _ {Y}) + \ sigma _ {Y} ^ {2 " } \ mu _ {X}} {\ sigma _ {Z} ^ {2}}} + {\ frac {\ sigma _ {X} ^ {2} (z ^ {2} + \ mu _ {Y} ^ {2} -2z \ mu _ {Y}) + \ sigma _ {Y} ^ {2} \ mu _ {X} ^ {2}} {\ sigma _ {Z} ^ {2}}}} {2 \ left ({\ frac {\ sigma _ {X} \ sigma _ {Y}} {\ sigma _ {Z}}} \ right) ^ {2}}} \ right] \, dx \\ [6pt] & = \ int _ {- \ infty} ^ {\ infty} {\ frac {1} {{\ sqrt {2 \ pi}} \ sigma _ {Z}}} {\ frac {1} {{\ sqrt {2 \ pi}} {\ frac {\ sigma _ {X} \ sigma _ {Y}} {\ sigma _ {Z}}}}} \ exp \ left [- {\ frac {\ left (x - {\ frac {\ sigma _ {X} ^ {2} (z- \ mu _ {Y}) + \ sigma _ {Y} ^ {2} \ mu _ {X}} {\ sigma _ {Z} ^ {2} }} \ right) ^ {2} - \ left ({\ frac {\ sigma _ {X} ^ {2} (z- \ mu _ {Y}) + \ sigma _ {Y} ^ {2} \ mu _ {X}} {\ sigma _ {Z} ^ {2}}} \ right) ^ {2} + {\ frac {\ sigma _ {X} ^ {2} (z- \ mu _ {Y}) ^ {2} + \ sigma _ {Y} ^ {2} \ mu _ {X} ^ {2}} {\ sigma _ {Z} ^ {2}}}} {2 \ left ({\ frac {\ sigma _ {X} \ sigma _ {Y}} {\ sigma _ {Z}}} \ derecha) ^ {2}}} \ derecha] \, dx \\ [6pt] & = \ int _ {- \ infty} ^ {\ infty} {\ frac {1} {{\ sqrt {2 \ pi}} \ sigma _ {Z}}} \ exp \ left [- {\ frac {\ sigma _ { Z} ^ {2} \ left (\ sigma _ {X} ^ {2} (z- \ mu _ {Y}) ^ {2} + \ sigma _ {Y} ^ {2} \ mu _ {X} ^ {2} \ right) - \ left (\ sigma _ {X} ^ {2} (z- \ mu _ {Y}) + \ sigma _ {Y} ^ {2} \ mu _ {X} \ right ) ^ {2}} {2 \ sigma _ {Z} ^ {2} \ left (\ sigma _ {X} \ sigma _ {Y} \ right) ^ {2}}} \ right] {\ frac {1 } {{\ sqrt {2 \ pi}} {\ frac {\ sigma _ {X} \ sigma _ {Y}} {\ sigma _ {Z}}}}} \ exp \ left [- {\ frac {\ izquierda (x - {\ frac {\ sigma _ {X} ^ {2} (z- \ mu _ {Y}) + \ sigma _ {Y} ^ {2} \ mu _ {X}} {\ sigma _ {Z} ^ {2}}} \ right) ^ {2}} {2 \ left ({\ frac {\ sigma _ {X} \ sigma _ {Y}} {\ sigma _ {Z}}} \ right ) ^ {2}}} \ right] \, dx \\ [6pt] & = {\ frac {1} {{\ sqrt {2 \ pi}} \ sigma _ {Z}}} \ exp \ left [- {(z - (\ mu _ {X} + \ mu _ {Y})) ^ {2} \ over 2 \ sigma _ {Z} ^ {2}} \ right] \ int _ {- \ infty} ^ {\ infty} {\ frac {1} {{\ sqrt {2 \ pi}} {\ frac {\ sigma _ {X} \ sigma _ {Y}} {\ sigma _ {Z}}}}} \ exp \ left [- {\ frac {\ left (x - {\ frac {\ sigma _ {X} ^ {2} (z- \ mu _ {Y})) + \ sigma _ {Y} ^ {2} \ mu " _ {X}} {\ sigma _ {Z} ^ {2}}} \ right) ^ {2}} {2 \ left ({\ frac {\ sigma _ {X} \ sigma _ {Y}} {\ sigma _ {Z}}} \ derecha) ^ {2}}} \ derecha] \, dx \ end {alineado} }}

La expresión en la integral es una distribución de densidad normal en x , por lo que la integral se evalúa como 1. El resultado deseado es el siguiente:

{\ Displaystyle f_ {Z} (z) = {\ frac {1} {{\ sqrt {2 \ pi}} \ sigma _ {Z}}} \ exp \ left [- {(z - (\ mu _ { X} + \ mu _ {Y})) ^ {2} \ over 2 \ sigma _ {Z} ^ {2}} \ right]}

Usando el teorema de convolución

Se puede demostrar que la transformada de Fourier de un gaussiano, ${\ Displaystyle f_ {X} (x) = {\ mathcal {N}} (x; \ mu _ {X}, \ sigma _ {X} ^ {2})}$ , es ^[3]

{\ Displaystyle {\ mathcal {F}} \ {f_ {X} \} = F_ {X} (\ omega) = \ exp \ left [-j \ omega \ mu _ {X} \ right] \ exp \ left [- {\ tfrac {\ sigma _ {X} ^ {2} \ omega ^ {2}} {2}} \ right]}

Por el teorema de convolución :

{\ Displaystyle {\ begin {alineado} f_ {Z} (z) & = (f_ {X} * f_ {Y}) (z) \\ [5pt] & = {\ mathcal {F}} ^ {- 1 } {\ big \ {} {\ mathcal {F}} \ {f_ {X} \} \ cdot {\ mathcal {F}} \ {f_ {Y} \} {\ big \}} \\ [5pt] & = {\ mathcal {F}} ^ {- 1} {\ big \ {} \ exp \ left [-j \ omega \ mu _ {X} \ right] \ exp \ left [- {\ tfrac {\ sigma _ {X} ^ {2} \ omega ^ {2}} {2}} \ right] \ exp \ left [-j \ omega \ mu _ {Y} \ right] \ exp \ left [- {\ tfrac { \ sigma _ {Y} ^ {2} \ omega ^ {2}} {2}} \ right] {\ big \}} \\ [5pt] & = {\ mathcal {F}} ^ {- 1} { \ big \ {} \ exp \ left [-j \ omega (\ mu _ {X} + \ mu _ {Y}) \ right] \ exp \ left [- {\ tfrac {(\ sigma _ {X} ^ {2} \ + \ sigma _ {Y} ^ {2}) \ omega ^ {2}} {2}} \ right] {\ big \}} \\ [5pt] & = {\ mathcal {N}} (z; \ mu _ {X} + \ mu _ {Y}, \ sigma _ {X} ^ {2} + \ sigma _ {Y} ^ {2}) \ end {alineado}}}

Prueba geométrica

Primero considere el caso normalizado cuando X , Y ~ N (0, 1), de modo que sus PDF sean

{\ Displaystyle f (x) = {\ frac {1} {\ sqrt {2 \ pi \,}}} e ^ {- x ^ {2} / 2}}

y

{\ Displaystyle g (y) = {\ frac {1} {\ sqrt {2 \ pi \,}}} e ^ {- y ^ {2} / 2}.}

Deje que Z = X + Y . Entonces el CDF para Z será

{\ Displaystyle z \ mapsto \ int _ {x + y \ leq z} f (x) g (y) \, dx \, dy.}

Esta integral está sobre el semiplano que se encuentra debajo de la línea x + y = z .

La observación clave es que la función

{\ Displaystyle f (x) g (y) = {\ frac {1} {2 \ pi}} e ^ {- (x ^ {2} + y ^ {2}) / 2} \,}

es radialmente simétrico. Entonces giramos el plano de coordenadas sobre el origen, eligiendo nuevas coordenadas ${\ Displaystyle x ', y'}$ tal que la recta x + y = z se describe mediante la ecuación ${\ Displaystyle x '= c}$ dónde ${\ Displaystyle c = c (z)}$ se determina geométricamente. Debido a la simetría radial, tenemos ${\ Displaystyle f (x) g (y) = f (x ') g (y')}$ , y el CDF para Z es

{\ Displaystyle \ int _ {x '\ leq c, y' \ in \ mathbb {R}} f (x ') g (y') \, dx '\, dy'.}

Esto es fácil de integrar; encontramos que el CDF para Z es

{\ Displaystyle \ int _ {- \ infty} ^ {c (z)} f ​​(x ') \, dx' = \ Phi (c (z)).}

Para determinar el valor ${\ Displaystyle c (z)}$ , tenga en cuenta que giramos el plano de modo que la línea x + y = z ahora corre verticalmente con una intersección en x igual a c . Entonces c es solo la distancia desde el origen a la línea x + y = z a lo largo de la bisectriz perpendicular, que se encuentra con la línea en su punto más cercano al origen, en este caso ${\ Displaystyle (z / 2, z / 2) \,}$ . Entonces la distancia es ${\ Displaystyle c = {\ sqrt {(z / 2) ^ {2} + (z / 2) ^ {2}}} = z / {\ sqrt {2}} \,}$ , y el CDF para Z es ${\ Displaystyle \ Phi (z / {\ sqrt {2}})}$ , es decir, ${\ Displaystyle Z = X + Y \ sim N (0,2).}$

Ahora, si a , b son constantes reales (no ambas cero), entonces la probabilidad de que ${\ Displaystyle aX + bY \ leq z}$ se encuentra por la misma integral que la anterior, pero con la línea delimitadora ${\ Displaystyle ax + by = z}$ . El mismo método de rotación funciona, y en este caso más general encontramos que el punto más cercano en la línea al origen está ubicado a una distancia (con signo)

{\ Displaystyle {\ frac {z} {\ sqrt {a ^ {2} + b ^ {2}}}}}

lejos, para que

{\ Displaystyle aX + bY \ sim N (0, a ^ {2} + b ^ {2}).}

El mismo argumento en dimensiones superiores muestra que si

{\ Displaystyle X_ {i} \ sim N (0, \ sigma _ {i} ^ {2}), \ qquad i = 1, \ dots, n,}

luego

{\ Displaystyle X_ {1} + \ cdots + X_ {n} \ sim N (0, \ sigma _ {1} ^ {2} + \ cdots + \ sigma _ {n} ^ {2}).}

Ahora esencialmente hemos terminado, porque

{\ Displaystyle X \ sim N (\ mu, \ sigma ^ {2}) \ Leftrightarrow {\ frac {1} {\ sigma}} (X- \ mu) \ sim N (0,1).}

Entonces, en general, si

{\ Displaystyle X_ {i} \ sim N (\ mu _ {i}, \ sigma _ {i} ^ {2}), \ qquad i = 1, \ dots, n,}

luego

{\ Displaystyle \ sum _ {i = 1} ^ {n} a_ {i} X_ {i} \ sim N \ left (\ sum _ {i = 1} ^ {n} a_ {i} \ mu _ {i }, \ sum _ {i = 1} ^ {n} (a_ {i} \ sigma _ {i}) ^ {2} \ right).}

Variables aleatorias correlacionadas

En el caso de que las variables X e Y sean conjuntamente variables aleatorias distribuidas normalmente, entonces X + Y todavía tiene una distribución normal (ver Distribución normal multivariante ) y la media es la suma de las medias. Sin embargo, las variaciones no son aditivas debido a la correlación. En efecto,

{\ Displaystyle \ sigma _ {X + Y} = {\ sqrt {\ sigma _ {X} ^ {2} + \ sigma _ {Y} ^ {2} +2 \ rho \ sigma _ {X} \ sigma _ {Y}}},}

donde ρ es la correlación . En particular, siempre que ρ <0, entonces la varianza es menor que la suma de las varianzas de X y Y .

Se pueden hacer extensiones de este resultado para más de dos variables aleatorias, utilizando la matriz de covarianza .

Prueba

En este caso (con X e Y con medias cero), se debe considerar

{\ Displaystyle {\ frac {1} {2 \ pi \ sigma _ {x} \ sigma _ {y} {\ sqrt {1- \ rho ^ {2}}}}} \ iint _ {x \, y} \ exp \ left [- {\ frac {1} {2 (1- \ rho ^ {2})}} \ left ({\ frac {x ^ {2}} {\ sigma _ {x} ^ {2} }} + {\ frac {y ^ {2}} {\ sigma _ {y} ^ {2}}} - {\ frac {2 \ rho xy} {\ sigma _ {x} \ sigma _ {y}} } \ derecha) \ derecha] \ delta (z- (x + y)) \, \ mathrm {d} x \, \ mathrm {d} y.}

Como arriba, se hace la sustitución ${\ Displaystyle y \ rightarrow zx}$

Esta integral es más complicada de simplificar analíticamente, pero se puede hacer fácilmente usando un programa de matemáticas simbólicas. La distribución de probabilidad f _Z ( z ) viene dada en este caso por

{\ Displaystyle f_ {Z} (z) = {\ frac {1} {{\ sqrt {2 \ pi}} \ sigma _ {+}}} \ exp \ left (- {\ frac {z ^ {2} } {2 \ sigma _ {+} ^ {2}}} \ right)}

dónde

{\ Displaystyle \ sigma _ {+} = {\ sqrt {\ sigma _ {x} ^ {2} + \ sigma _ {y} ^ {2} +2 \ rho \ sigma _ {x} \ sigma _ {y }}}.}

Si se considera en cambio Z = X - Y , entonces se obtiene

{\ Displaystyle f_ {Z} (z) = {\ frac {1} {\ sqrt {2 \ pi (\ sigma _ {x} ^ {2} + \ sigma _ {y} ^ {2} -2 \ rho \ sigma _ {x} \ sigma _ {y})}}} \ exp \ left (- {\ frac {z ^ {2}} {2 (\ sigma _ {x} ^ {2} + \ sigma _ { y} ^ {2} -2 \ rho \ sigma _ {x} \ sigma _ {y})}} \ right)}

que también se puede reescribir con

{\ Displaystyle \ sigma _ {-} = {\ sqrt {\ sigma _ {x} ^ {2} + \ sigma _ {y} ^ {2} -2 \ rho \ sigma _ {x} \ sigma _ {y }}}.}

Las desviaciones estándar de cada distribución son obvias en comparación con la distribución normal estándar.

Referencias

^ Limones, Don S. (2002), Introducción a los procesos estocásticos en física , The Johns Hopkins University Press, p. 34, ISBN 0-8018-6866-1
^ Limones (2002) págs. 35-36
^ Derpanis, Konstantinos G. (20 de octubre de 2005). "Transformada de Fourier del gaussiano" (PDF) .

Ver también

[1] Limones, Don S. (2002), Introducción a los procesos estocásticos en física , The Johns Hopkins University Press, p. 34, ISBN 0-8018-6866-1

[2] Limones (2002) págs. 35-36

[3] Derpanis, Konstantinos G. (20 de octubre de 2005). "Transformada de Fourier del gaussiano" (PDF) .

[1]