Distribución normal plegada

La distribución normal plegada es una distribución de probabilidad relacionada con la distribución normal . Dada una variable aleatoria X normalmente distribuida con media μ y varianza σ ² , la variable aleatoria Y = | X | tiene una distribución normal plegada. Tal caso se puede encontrar si solo se registra la magnitud de alguna variable, pero no su signo. La distribución se llama "plegada" porque la masa de probabilidad a la izquierda de x = 0 se dobla tomando el valor absoluto . En la física de la conducción de calor, la distribución normal plegada es una solución fundamental de la ecuación de calor en el medio espacio; corresponde a tener un aislante perfecto en un hiperplano a través del origen.

Función de densidad de probabilidad $μ = 1, σ = 1$
Función de distribución acumulativa $μ = 1, σ = 1$
Parámetros	$μ \in R$ ( ubicación ) $σ 2 > 0$ ( escala )
Apoyo	$x \in [0, \infty)$
PDF	${\ Displaystyle {\ frac {1} {\ sigma {\ sqrt {2 \ pi}}}} \, e ^ {- {\ frac {(x- \ mu) ^ {2}} {2 \ sigma ^ { 2}}}} + {\ frac {1} {\ sigma {\ sqrt {2 \ pi}}}} \, e ^ {- {\ frac {(x + \ mu) ^ {2}} {2 \ sigma ^ {2}}}}}$
CDF	${\ Displaystyle {\ frac {1} {2}} \ left [{\ mbox {erf}} \ left ({\ frac {x + \ mu} {\ sigma {\ sqrt {2}}}} \ right) + {\ mbox {erf}} \ left ({\ frac {x- \ mu} {\ sigma {\ sqrt {2}}}} \ right) \ right]}$
Significar	${\ Displaystyle \ mu _ {Y} = \ sigma {\ sqrt {\ tfrac {2} {\ pi}}} \, e ^ {(- \ mu ^ {2} / 2 \ sigma ^ {2})} + \ mu \ left (1-2 \, \ Phi (- {\ tfrac {\ mu} {\ sigma}}) \ right)}$
Diferencia	${\ Displaystyle \ sigma _ {Y} ^ {2} = \ mu ^ {2} + \ sigma ^ {2} - \ mu _ {Y} ^ {2}}$

Definiciones

Densidad

La función de densidad de probabilidad (PDF) está dada por

{\ Displaystyle f_ {Y} (x; \ mu, \ sigma ^ {2}) = {\ frac {1} {\ sqrt {2 \ pi \ sigma ^ {2}}}} \, e ^ {- { \ frac {(x- \ mu) ^ {2}} {2 \ sigma ^ {2}}}} + {\ frac {1} {\ sqrt {2 \ pi \ sigma ^ {2}}}} \, e ^ {- {\ frac {(x + \ mu) ^ {2}} {2 \ sigma ^ {2}}}}}

para x ≥ 0, y 0 en todos los demás lugares. Una formulación alternativa viene dada por

{\ Displaystyle f \ left (x \ right) = {\ sqrt {\ frac {2} {\ pi \ sigma ^ {2}}}} e ^ {- {\ frac {\ left (x ^ {2} + \ mu ^ {2} \ right)} {2 \ sigma ^ {2}}}} \ cosh {\ left ({\ frac {\ mu x} {\ sigma ^ {2}}} \ right)}}

,

donde cosh es el coseno Función hiperbólica . De ello se deduce que la función de distribución acumulativa (CDF) viene dada por:

{\ Displaystyle F_ {Y} (x; \ mu, \ sigma ^ {2}) = {\ frac {1} {2}} \ left [{\ mbox {erf}} \ left ({\ frac {x + \ mu} {\ sqrt {2 \ sigma ^ {2}}}} \ right) + {\ mbox {erf}} \ left ({\ frac {x- \ mu} {\ sqrt {2 \ sigma ^ {2} }}}\bien bien]}

para x ≥ 0, donde erf () es la función de error . Esta expresión se reduce a la CDF de la distribución media normal cuando μ = 0.

La media de la distribución plegada es entonces

{\ Displaystyle \ mu _ {Y} = \ sigma {\ sqrt {\ frac {2} {\ pi}}} \, \, \ exp \ left ({\ frac {- \ mu ^ {2}} {2 \ sigma ^ {2}}} \ right) + \ mu \, {\ mbox {erf}} \ left ({\ frac {\ mu} {\ sqrt {2 \ sigma ^ {2}}}} \ right) }

o

{\ Displaystyle \ mu _ {Y} = {\ sqrt {\ frac {2} {\ pi}}} \ sigma e ^ {- {\ frac {\ mu ^ {2}} {2 \ sigma ^ {2} }}} + \ mu \ left [1-2 \ Phi \ left (- {\ frac {\ mu} {\ sigma}} \ right) \ right]}

dónde ${\ Displaystyle \ Phi}$ es la función de distribución acumulativa normal :

{\ Displaystyle \ Phi (x) \; = \; {\ frac {1} {2}} \ left [1+ \ operatorname {erf} \ left ({\ frac {x} {\ sqrt {2}}} \bien bien].}

Entonces, la varianza se expresa fácilmente en términos de la media:

{\ Displaystyle \ sigma _ {Y} ^ {2} = \ mu ^ {2} + \ sigma ^ {2} - \ mu _ {Y} ^ {2}.}

Tanto la media ( μ ) como la varianza ( σ ² ) de X en la distribución normal original se pueden interpretar como la ubicación y los parámetros de escala de Y en la distribución plegada.

Propiedades

Modo

La moda de la distribución es el valor de ${\ Displaystyle x}$ para lo cual se maximiza la densidad. Para encontrar este valor, tomamos la primera derivada de la densidad con respecto a ${\ Displaystyle x}$ y ajústelo a cero. Desafortunadamente, no existe un formulario cerrado. Sin embargo, podemos escribir la derivada de una mejor manera y terminar con una ecuación no lineal.

${\ displaystyle {\ frac {df (x)} {dx}} = 0 \ Rightarrow - {\ frac {\ left (x- \ mu \ right)} {\ sigma ^ {2}}} e ^ {- { \ frac {1} {2}} {\ frac {\ left (x- \ mu \ right) ^ {2}} {\ sigma ^ {2}}}} - {\ frac {\ left (x + \ mu \ derecha)} {\ sigma ^ {2}}} e ^ {- {\ frac {1} {2}} {\ frac {\ izquierda (x + \ mu \ derecha) ^ {2}} {\ sigma ^ {2 }}}} = 0}$

${\ Displaystyle x \ left [e ^ {- {\ frac {1} {2}} {\ frac {\ left (x- \ mu \ right) ^ {2}} {\ sigma ^ {2}}}} + e ^ {- {\ frac {1} {2}} {\ frac {\ left (x + \ mu \ right) ^ {2}} {\ sigma ^ {2}}}} \ right] - \ mu \ izquierda [e ^ {- {\ frac {1} {2}} {\ frac {\ left (x- \ mu \ right) ^ {2}} {\ sigma ^ {2}}}} - e ^ {- {\ frac {1} {2}} {\ frac {\ left (x + \ mu \ right) ^ {2}} {\ sigma ^ {2}}}} \ right] = 0}$

${\ Displaystyle x \ left (1 + e ^ {- {\ frac {2 \ mu x} {\ sigma ^ {2}}}} \ right) - \ mu \ left (1-e ^ {- {\ frac {2 \ mu x} {\ sigma ^ {2}}}} \ right) = 0}$

${\ Displaystyle \ left (\ mu + x \ right) e ^ {- {\ frac {2 \ mu x} {\ sigma ^ {2}}}} = \ mu -x}$

${\ Displaystyle x = - {\ frac {\ sigma ^ {2}} {2 \ mu}} \ log {\ frac {\ mu -x} {\ mu + x}}}$ .

Tsagris y col. (2014) vieron en la investigación numérica que cuando ${\ Displaystyle \ mu <\ sigma}$ , el máximo se alcanza cuando ${\ Displaystyle x = 0}$ , y cuando ${\ Displaystyle \ mu}$ se vuelve mayor que ${\ Displaystyle 3 \ sigma}$ , el máximo se acerca ${\ Displaystyle \ mu}$ . Por supuesto, esto es algo de esperar, ya que, en este caso, la normal plegada converge a la distribución normal. Para evitar problemas con las variaciones negativas, se sugiere la exponenciación del parámetro. Alternativamente, puede agregar una restricción, por ejemplo, si el optimizador busca una varianza negativa, el valor de la probabilidad logarítmica es NA o algo muy pequeño.

Función característica y otras funciones relacionadas

La función característica está dada por

${\ Displaystyle \ varphi _ {x} \ left (t \ right) = e ^ {{\ frac {- \ sigma ^ {2} t ^ {2}} {2}} + i \ mu t} \ Phi \ izquierda ({\ frac {\ mu} {\ sigma}} + i \ sigma t \ right) + e ^ {- {\ frac {\ sigma ^ {2} t ^ {2}} {2}} - i \ mu t} \ Phi \ left (- {\ frac {\ mu} {\ sigma}} + i \ sigma t \ right)}$ .

La función generadora de momentos está dada por

${\ Displaystyle M_ {x} \ left (t \ right) = \ varphi _ {x} \ left (-it \ right) = e ^ {{\ frac {\ sigma ^ {2} t ^ {2}} { 2}} + \ mu t} \ Phi \ left ({\ frac {\ mu} {\ sigma}} + \ sigma t \ right) + e ^ {{\ frac {\ sigma ^ {2} t ^ {2 }} {2}} - \ mu t} \ Phi \ left (- {\ frac {\ mu} {\ sigma}} + \ sigma t \ right)}$ .

La función de generación acumulada está dada por

${\ Displaystyle K_ {x} \ left (t \ right) = \ log {M_ {x} \ left (t \ right)} = \ left ({\ frac {\ sigma ^ {2} t ^ {2}} {2}} + \ mu t \ right) + \ log {\ left \ lbrace 1- \ Phi \ left (- {\ frac {\ mu} {\ sigma}} - \ sigma t \ right) + e ^ { {\ frac {\ sigma ^ {2} t ^ {2}} {2}} - \ mu t} \ left [1- \ Phi \ left ({\ frac {\ mu} {\ sigma}} - \ sigma t \ right) \ right] \ right \ rbrace}}$ .

La transformación de Laplace viene dada por

${\ Displaystyle E \ left (e ^ {- tx} \ right) = e ^ {{\ frac {\ sigma ^ {2} t ^ {2}} {2}} - \ mu t} \ left [1- \ Phi \ left (- {\ frac {\ mu} {\ sigma}} + \ sigma t \ right) \ right] + e ^ {{\ frac {\ sigma ^ {2} t ^ {2}} {2 }} + \ mu t} \ left [1- \ Phi \ left ({\ frac {\ mu} {\ sigma}} + \ sigma t \ right) \ right]}$ .

La transformada de Fourier está dada por

${\ Displaystyle {\ hat {f}} \ left (t \ right) = \ phi _ {x} \ left (-2 \ pi t \ right) = e ^ {{\ frac {-4 \ pi ^ {2 } \ sigma ^ {2} t ^ {2}} {2}} - i2 \ pi \ mu t} \ left [1- \ Phi \ left (- {\ frac {\ mu} {\ sigma}} - i2 \ pi \ sigma t \ right) \ right] + e ^ {- {\ frac {4 \ pi ^ {2} \ sigma ^ {2} t ^ {2}} {2}} + i2 \ pi \ mu t } \ left [1- \ Phi \ left ({\ frac {\ mu} {\ sigma}} - i2 \ pi \ sigma t \ right) \ right]}$ .

Distribuciones relacionadas

Cuando $μ = 0$ , la distribución de $Y$ es la mitad de la distribución normal .
La variable aleatoria $(Y / σ) 2$ tiene una distribución chi-cuadrado no central con 1 grado de libertad y no centralidad igual a $(μ / σ) 2$ .
La distribución normal plegada también puede verse como el límite de la distribución t plegada no estandarizada cuando los grados de libertad van al infinito.
Existe una versión bivariada desarrollada por Psarakis y Panaretos (2001) así como una versión multivariada desarrollada por Chakraborty y Moutushi (2013).
La distribución de Rice es una generalización multivariante de la distribución normal plegada.

Inferencia estadística

Estimación de parámetros

Hay algunas formas de estimar los parámetros de la normal plegada. Todos ellos son esencialmente el procedimiento de estimación de máxima verosimilitud, pero en algunos casos se realiza una maximización numérica, mientras que en otros casos se busca la raíz de una ecuación. La probabilidad logarítmica de la normal plegada cuando una muestra ${\ Displaystyle x_ {i}}$ de tamaño ${\ Displaystyle n}$ está disponible se puede escribir de la siguiente manera

${\ Displaystyle l = - {\ frac {n} {2}} \ log {2 \ pi \ sigma ^ {2}} + \ sum _ {i = 1} ^ {n} \ log {\ left [e ^ {- {\ frac {\ left (x_ {i} - \ mu \ right) ^ {2}} {2 \ sigma ^ {2}}}} + e ^ {- {\ frac {\ left (x_ {i } + \ mu \ right) ^ {2}} {2 \ sigma ^ {2}}}} \ right]}}$

${\ Displaystyle l = - {\ frac {n} {2}} \ log {2 \ pi \ sigma ^ {2}} + \ sum _ {i = 1} ^ {n} \ log {\ left [e ^ {- {\ frac {\ left (x_ {i} - \ mu \ right) ^ {2}} {2 \ sigma ^ {2}}}} \ left (1 + e ^ {- {\ frac {\ left (x_ {i} + \ mu \ right) ^ {2}} {2 \ sigma ^ {2}}}} e ^ {\ frac {\ left (x_ {i} - \ mu \ right) ^ {2} } {2 \ sigma ^ {2}}} \ right) \ right]}}$

${\ Displaystyle l = - {\ frac {n} {2}} \ log {2 \ pi \ sigma ^ {2}} - \ sum _ {i = 1} ^ {n} {\ frac {\ left (x_ {i} - \ mu \ right) ^ {2}} {2 \ sigma ^ {2}}} + \ sum _ {i = 1} ^ {n} \ log {\ left (1 + e ^ {- { \ frac {2 \ mu x_ {i}} {\ sigma ^ {2}}}} \ right)}}$

En R (lenguaje de programación) , usando el paquete Rfast se puede obtener el MLE realmente rápido (comando foldnorm.mle). Alternativamente, el comando Optim o NLM se ajustan a esta distribución. La maximización es fácil, ya que dos parámetros ( ${\ Displaystyle \ mu}$ y ${\ Displaystyle \ sigma ^ {2}}$ ) estan involucrados. Tenga en cuenta que los valores positivos y negativos de ${\ Displaystyle \ mu}$ son aceptables, ya que ${\ Displaystyle \ mu}$ pertenece a la línea real de números, por lo tanto, el signo no es importante porque la distribución es simétrica con respecto a él. El siguiente código está escrito en R

plegado  <-  función ( y )  { ## y es un vector con datos positivos  n  <-  longitud ( y )  ## tamaño de muestra  sy2  <-  suma ( y ^ 2 ) sam  <-  función ( para ,  n ,  sy2 )  {  me  <-  para [ 1 ]  ;  SE  <-  exp (  párrafo [ 2 ]  )  f  <-  -  n / 2  *  log ( 2 / pi / SE )  +  n  *  me ^ 2  /  2  /  SE  +  SY2  /  2  /  SE  -  suma (  log (  cosh (  me  *  y / se  )  )  )  f  } mod  <-  optim (  c (  media ( y ),  sd ( y )  ),  n  =  n ,  sy2  =  sy2 ,  sam ,  control  =  lista ( maxit  =  2000 )  )  mod  <-  optim (  mod $ par ,  sam ,  n  =  n ,  sy2  =  sy2 ,  control  =  lista ( maxit  =  20000 )  )  resultado  <-  c (  - mod $ valor ,  mod $ par [ 1 ],  exp ( mod $ par [ 2 ])  )  nombres ( resultado )  <-  c ( "log-verosimilitud" ,  "mu" ,  "sigma al cuadrado" )  resultado}

Las derivadas parciales de la probabilidad logarítmica se escriben como

${\ Displaystyle {\ frac {\ parcial l} {\ parcial \ mu}} = {\ frac {\ sum _ {i = 1} ^ {n} \ left (x_ {i} - \ mu \ right)} { \ sigma ^ {2}}} - {\ frac {2} {\ sigma ^ {2}}} \ sum _ {i = 1} ^ {n} {\ frac {x_ {i} e ^ {\ frac { -2 \ mu x_ {i}} {\ sigma ^ {2}}}} {1 + e ^ {\ frac {-2 \ mu x_ {i}} {\ sigma ^ {2}}}}}}$

${\ Displaystyle {\ frac {\ parcial l} {\ parcial \ mu}} = {\ frac {\ sum _ {i = 1} ^ {n} \ left (x_ {i} - \ mu \ right)} { \ sigma ^ {2}}} - {\ frac {2} {\ sigma ^ {2}}} \ sum _ {i = 1} ^ {n} {\ frac {x_ {i}} {1 + e ^ {\ frac {2 \ mu x_ {i}} {\ sigma ^ {2}}}}} \ \ {\ text {y}}}$

${\ Displaystyle {\ frac {\ parcial l} {\ parcial \ sigma ^ {2}}} = - {\ frac {n} {2 \ sigma ^ {2}}} + {\ frac {\ sum _ {i = 1} ^ {n} \ left (x_ {i} - \ mu \ right) ^ {2}} {2 \ sigma ^ {4}}} + {\ frac {2 \ mu} {\ sigma ^ {4 }}} \ sum _ {i = 1} ^ {n} {\ frac {x_ {i} e ^ {- {\ frac {2 \ mu x_ {i}} {\ sigma ^ {2}}}}} {1 + e ^ {- {\ frac {2 \ mu x_ {i}} {\ sigma ^ {2}}}}}}}$

${\ Displaystyle {\ frac {\ parcial l} {\ parcial \ sigma ^ {2}}} = - {\ frac {n} {2 \ sigma ^ {2}}} + {\ frac {\ sum _ {i = 1} ^ {n} \ left (x_ {i} - \ mu \ right) ^ {2}} {2 \ sigma ^ {4}}} + {\ frac {2 \ mu} {\ sigma ^ {4 }}} \ sum _ {i = 1} ^ {n} {\ frac {x_ {i}} {1 + e ^ {\ frac {2 \ mu x_ {i}} {\ sigma ^ {2}}} }}}$ .

Al igualar la primera derivada parcial de la probabilidad logarítmica a cero, obtenemos una buena relación

${\ Displaystyle \ sum _ {i = 1} ^ {n} {\ frac {x_ {i}} {1 + e ^ {\ frac {2 \ mu x_ {i}} {\ sigma ^ {2}}} }} = {\ frac {\ sum _ {i = 1} ^ {n} \ left (x_ {i} - \ mu \ right)} {2}}}$ .

Tenga en cuenta que la ecuación anterior tiene tres soluciones, una en cero y dos más con el signo opuesto. Sustituyendo la ecuación anterior, a la derivada parcial de la probabilidad logarítmica wrt ${\ Displaystyle \ sigma ^ {2}}$ y equiparándolo a cero, obtenemos la siguiente expresión para la varianza

${\ Displaystyle \ sigma ^ {2} = {\ frac {\ sum _ {i = 1} ^ {n} \ left (x_ {i} - \ mu \ right) ^ {2}} {n}} + { \ frac {2 \ mu \ sum _ {i = 1} ^ {n} \ left (x_ {i} - \ mu \ right)} {n}} = {\ frac {\ sum _ {i = 1} ^ {n} \ left (x_ {i} ^ {2} - \ mu ^ {2} \ right)} {n}} = {\ frac {\ sum _ {i = 1} ^ {n} x_ {i} ^ {2}} {n}} - \ mu ^ {2}}$ ,

que es la misma fórmula que en la distribución normal . Una diferencia principal aquí es que ${\ Displaystyle \ mu}$ y ${\ Displaystyle \ sigma ^ {2}}$ no son estadísticamente independientes. Las relaciones anteriores se pueden utilizar para obtener estimaciones de máxima verosimilitud de una manera recursiva eficiente. Comenzamos con un valor inicial para ${\ Displaystyle \ sigma ^ {2}}$ y encuentra la raíz positiva ( ${\ Displaystyle \ mu}$ ) de la última ecuación. Luego, obtenemos un valor actualizado de ${\ Displaystyle \ sigma ^ {2}}$ . El procedimiento se repite hasta que el cambio en el valor de probabilidad logarítmica es insignificante. Otra forma más sencilla y eficaz es realizar un algoritmo de búsqueda. Escribamos la última ecuación de una manera más elegante.

${\ Displaystyle 2 \ sum _ {i = 1} ^ {n} {\ frac {x_ {i}} {1 + e ^ {\ frac {2 \ mu x_ {i}} {\ sigma ^ {2}} }}} - \ sum _ {i = 1} ^ {n} {\ frac {x_ {i} \ left (1 + e ^ {\ frac {2 \ mu x_ {i}} {\ sigma ^ {2}) }} \ right)} {1 + e ^ {\ frac {2 \ mu x_ {i}} {\ sigma ^ {2}}}}} + n \ mu = 0}$

${\ Displaystyle \ sum _ {i = 1} ^ {n} {\ frac {x_ {i} \ left (1-e ^ {\ frac {2 \ mu x_ {i}} {\ sigma ^ {2}} } \ right)} {1 + e ^ {\ frac {2 \ mu x_ {i}} {\ sigma ^ {2}}}}} + n \ mu = 0}$ .

Queda claro que la optimización de la probabilidad logarítmica con respecto a los dos parámetros se ha convertido en una búsqueda de raíz de una función. Esto, por supuesto, es idéntico a la búsqueda de raíz anterior. Tsagris y col. (2014) descubrió que hay tres raíces en esta ecuación para ${\ Displaystyle \ mu}$ , es decir, hay tres valores posibles de ${\ Displaystyle \ mu}$ que satisfacen esta ecuación. La ${\ Displaystyle - \ mu}$ y ${\ Displaystyle + \ mu}$ , que son las estimaciones de máxima verosimilitud y 0, que corresponde al mínimo logarítmico de verosimilitud.

Ver también

Referencias

Tsagris, M .; Beneki, C .; Hassani, H. (2014). "Sobre la distribución normal plegada". Matemáticas . 2 (1): 12-28. arXiv : 1402.3559 .
Leone FC, Nottingham RB, Nelson LS (1961). "La distribución normal plegada". Tecnometría . 3 (4): 543–550. doi : 10.2307 / 1266560 . hdl : 2027 / mdp.39015095248541 . JSTOR 1266560 .
Johnson NL (1962). "La distribución normal plegada: precisión de la estimación por máxima verosimilitud". Tecnometría . 4 (2): 249-256. doi : 10.2307 / 1266622 . JSTOR 1266622 .
Nelson LS (1980). "La distribución normal plegada". J Qual Technol . 12 (4): 236–238.
Elandt RC (1961). "La distribución normal plegada: dos métodos de estimación de parámetros a partir de momentos". Tecnometría . 3 (4): 551–562. doi : 10.2307 / 1266561 . JSTOR 1266561 .
Lin PC (2005). "Aplicación de la distribución normal plegada generalizada a las medidas de capacidad del proceso". Int J Adv Manuf Technol . 26 (7–8): 825–830. doi : 10.1007 / s00170-003-2043-x .
Psarakis, S .; Panaretos, J. (1990). "La distribución t plegada". Comunicaciones en estadística: teoría y métodos . 19 (7): 2717–2734.
Psarakis, S .; Panaretos, J. (2001). "En algunas extensiones bivariadas de las distribuciones plegada normal y plegada-t". Revista de ciencia estadística aplicada . 10 (2): 119-136.
Chakraborty, AK; Moutushi, C. (2013). "Sobre distribución normal plegada multivariante". Sânkhya B . 75 (1): 1-15.

enlaces externos

Aleatorio (anteriormente Laboratorios virtuales): la distribución normal plegada