Deje que X y Y sean independientes variables aleatorias que se distribuyen normalmente (y por tanto también de forma conjunta de modo), entonces su suma es también normalmente distribuidos. es decir, si
luego
Esto significa que la suma de dos variables aleatorias independientes distribuidas normalmente es normal, siendo su media la suma de las dos medias y su varianza la suma de las dos varianzas (es decir, el cuadrado de la desviación estándar es la suma de las cuadrados de las desviaciones estándar). [1]
Para que este resultado se mantenga, la suposición de que X e Y son independientes no puede descartarse, aunque puede debilitarse a la suposición de que X e Y están distribuidas normalmente de forma conjunta , en lugar de por separado. [2] (Vea aquí un ejemplo ).
El resultado de la media se mantiene en todos los casos, mientras que el resultado de la varianza requiere falta de correlación, pero no independencia.
Pruebas
Prueba usando funciones características
La función característica
de la suma de dos variables aleatorias independientes X e Y es solo el producto de las dos funciones características separadas:
de X y Y .
La función característica de la distribución normal con valor esperado μ y varianza σ 2 es
Entonces
Esta es la función característica de la distribución normal con valor esperado y varianza
Finalmente, recuerde que no hay dos distribuciones distintas que puedan tener la misma función característica, por lo que la distribución de X + Y debe ser solo esta distribución normal.
Prueba mediante convoluciones
Para las variables aleatorias independientes X e Y , la distribución f Z de Z = X + Y es igual a la convolución de f X y f Y :
Dado que f X y f Y son densidades normales,
Sustituyendo en la convolución:
Definiendo , y completando el cuadrado :
La expresión en la integral es una distribución de densidad normal en x , por lo que la integral se evalúa como 1. El resultado deseado es el siguiente:
Se puede demostrar que la transformada de Fourier de un gaussiano,, es [3]
Por el teorema de convolución :
Prueba geométrica
Primero considere el caso normalizado cuando X , Y ~ N (0, 1), de modo que sus PDF sean
y
Deje que Z = X + Y . Entonces el CDF para Z será
Esta integral está sobre el semiplano que se encuentra debajo de la línea x + y = z .
La observación clave es que la función
es radialmente simétrico. Entonces giramos el plano de coordenadas sobre el origen, eligiendo nuevas coordenadastal que la recta x + y = z se describe mediante la ecuación dónde se determina geométricamente. Debido a la simetría radial, tenemos, y el CDF para Z es
Esto es fácil de integrar; encontramos que el CDF para Z es
Para determinar el valor , tenga en cuenta que giramos el plano de modo que la línea x + y = z ahora corre verticalmente con una intersección en x igual a c . Entonces c es solo la distancia desde el origen a la línea x + y = z a lo largo de la bisectriz perpendicular, que se encuentra con la línea en su punto más cercano al origen, en este caso. Entonces la distancia es, y el CDF para Z es, es decir,
Ahora, si a , b son constantes reales (no ambas cero), entonces la probabilidad de que se encuentra por la misma integral que la anterior, pero con la línea delimitadora . El mismo método de rotación funciona, y en este caso más general encontramos que el punto más cercano en la línea al origen está ubicado a una distancia (con signo)
lejos, para que
El mismo argumento en dimensiones superiores muestra que si
luego
Ahora esencialmente hemos terminado, porque
Entonces, en general, si
luego
En el caso de que las variables X e Y sean conjuntamente variables aleatorias distribuidas normalmente, entonces X + Y todavía tiene una distribución normal (ver Distribución normal multivariante ) y la media es la suma de las medias. Sin embargo, las variaciones no son aditivas debido a la correlación. En efecto,
donde ρ es la correlación . En particular, siempre que ρ <0, entonces la varianza es menor que la suma de las varianzas de X y Y .
Se pueden hacer extensiones de este resultado para más de dos variables aleatorias, utilizando la matriz de covarianza .
Prueba
En este caso (con X e Y con medias cero), se debe considerar
Como arriba, se hace la sustitución
Esta integral es más complicada de simplificar analíticamente, pero se puede hacer fácilmente usando un programa de matemáticas simbólicas. La distribución de probabilidad f Z ( z ) viene dada en este caso por
dónde
Si se considera en cambio Z = X - Y , entonces se obtiene
que también se puede reescribir con
Las desviaciones estándar de cada distribución son obvias en comparación con la distribución normal estándar.