Distribución normal sesgada

En teoría de probabilidad y estadística , la distribución normal sesgada es una distribución de probabilidad continua que generaliza la distribución normal para permitir una asimetría distinta de cero .

Sesgo normal
Función de densidad de probabilidad
Función de distribución acumulativa
Parámetros	${\ Displaystyle \ xi \,}$ ubicación ( real ) ${\ Displaystyle \ omega \,}$ escala (positiva, real ) ${\ Displaystyle \ alpha \,}$ forma ( real )
Apoyo	${\ Displaystyle x \ in (- \ infty; + \ infty) \!}$
PDF	${\ displaystyle {\ frac {2} {\ omega {\ sqrt {2 \ pi}}}} e ^ {- {\ frac {(x- \ xi) ^ {2}} {2 \ omega ^ {2} }}} \ int _ {- \ infty} ^ {\ alpha \ left ({\ frac {x- \ xi} {\ omega}} \ right)} {\ frac {1} {\ sqrt {2 \ pi} }} e ^ {- {\ frac {t ^ {2}} {2}}} \ dt}$
CDF	${\ Displaystyle \ Phi \ left ({\ frac {x- \ xi} {\ omega}} \ right) -2T \ left ({\ frac {x- \ xi} {\ omega}}, \ alpha \ right) }$ ${\ Displaystyle T (h, a)}$ es la función T de Owen
Significar	${\ Displaystyle \ xi + \ omega \ delta {\ sqrt {\ frac {2} {\ pi}}}}$ dónde ${\ Displaystyle \ delta = {\ frac {\ alpha} {\ sqrt {1+ \ alpha ^ {2}}}}}$
Modo	${\ Displaystyle \ xi + \ omega m_ {o} (\ alpha)}$
Diferencia	${\ Displaystyle \ omega ^ {2} \ left (1 - {\ frac {2 \ delta ^ {2}} {\ pi}} \ right)}$
Oblicuidad	${\ Displaystyle \ gamma _ {1} = {\ frac {4- \ pi} {2}} {\ frac {\ left (\ delta {\ sqrt {2 / \ pi}} \ right) ^ {3}} {\ left (1-2 \ delta ^ {2} / \ pi \ right) ^ {3/2}}}}$
Ex. curtosis	${\ Displaystyle 2 (\ pi -3) {\ frac {\ left (\ delta {\ sqrt {2 / \ pi}} \ right) ^ {4}} {\ left (1-2 \ delta ^ {2} / \ pi \ right) ^ {2}}}}$
MGF	${\ Displaystyle M_ {X} \ left (t \ right) = 2 \ exp \ left (\ xi t + {\ frac {\ omega ^ {2} t ^ {2}} {2}} \ right) \ Phi \ izquierda (\ omega \ delta t \ right)}$
CF	${\ displaystyle e ^ {it \ xi -t ^ {2} \ omega ^ {2} / 2} \ left (1 + i \, {\ textrm {Erfi}} \ left ({\ frac {\ delta \ omega t} {\ sqrt {2}}} \ right) \ right)}$

Definición

Dejar ${\ Displaystyle \ phi (x)}$ denotar la función de densidad de probabilidad normal estándar

{\ Displaystyle \ phi (x) = {\ frac {1} {\ sqrt {2 \ pi}}} e ^ {- {\ frac {x ^ {2}} {2}}}}

con la función de distribución acumulativa dada por

{\ Displaystyle \ Phi (x) = \ int _ {- \ infty} ^ {x} \ phi (t) \ dt = {\ frac {1} {2}} \ left [1+ \ operatorname {erf} \ izquierda ({\ frac {x} {\ sqrt {2}}} \ right) \ right]}

,

donde "erf" es la función de error . Luego, la función de densidad de probabilidad (pdf) de la distribución normal sesgada con parámetro ${\ Displaystyle \ alpha}$ es dado por

{\ Displaystyle f (x) = 2 \ phi (x) \ Phi (\ alpha x). \,}

Esta distribución fue introducida por primera vez por O'Hagan y Leonard (1976). ^[1] Ashour y Abdel-Hamid ^[2] y Mudholkar y Hutson han dado aproximaciones a esta distribución que son más fáciles de manipular matemáticamente . ^[3]

Andel, Netuka y Zvara (1984) describieron un proceso estocástico que sustenta la distribución. ^[4] Tanto la distribución como los fundamentos de su proceso estocástico fueron consecuencia del argumento de simetría desarrollado en Chan y Tong (1986), ^[5] que se aplica a casos multivariados más allá de la normalidad, por ejemplo, distribución t multivariada sesgada y otros. La distribución es un caso particular de una clase general de distribuciones con funciones de densidad de probabilidad de la forma f (x) = 2 φ (x) Φ (x) donde φ () es cualquier PDF simétrico con respecto a cero y Φ () es cualquier CDF cuyo PDF es simétrico con respecto a cero. ^[6]

Para agregar parámetros de ubicación y escala a esto, uno hace la transformación habitual ${\ displaystyle x \ rightarrow {\ frac {x- \ xi} {\ omega}}}$ . Se puede verificar que la distribución normal se recupera cuando ${\ Displaystyle \ alpha = 0}$ , y que el valor absoluto de la asimetría aumenta a medida que el valor absoluto de ${\ Displaystyle \ alpha}$ aumenta. La distribución está sesgada a la derecha si ${\ Displaystyle \ alpha> 0}$ y se deja sesgado si ${\ Displaystyle \ alpha <0}$ . La función de densidad de probabilidad con ubicación ${\ Displaystyle \ xi}$ , escala ${\ Displaystyle \ omega}$ y parámetro ${\ Displaystyle \ alpha}$ se convierte en

{\ Displaystyle f (x) = {\ frac {2} {\ omega}} \ phi \ left ({\ frac {x- \ xi} {\ omega}} \ right) \ Phi \ left (\ alpha \ left ({\ frac {x- \ xi} {\ omega}} \ right) \ right). \,}

Sin embargo, tenga en cuenta que la asimetría ( ${\ Displaystyle \ gamma _ {1}}$ ) de la distribución se limita al intervalo ${\ displaystyle (-1,1)}$ .

Como se ha mostrado, ^[7] el modo (máximo) de la distribución es único. En general ${\ Displaystyle \ alpha}$ no hay expresión analítica para ${\ Displaystyle m_ {o}}$ , pero una aproximación bastante precisa (numérica) es:

{\ Displaystyle m_ {o} (\ alpha) \ approx \ mu _ {z} - {\ frac {\ gamma _ {1} \ sigma _ {z}} {2}} - {\ frac {\ mathrm {sgn } (\ alpha)} {2}} \ exp \ left (- {\ frac {2 \ pi} {| \ alpha |}} \ right)}

dónde ${\ Displaystyle \ mu _ {z} = {\ sqrt {\ frac {2} {\ pi}}} \ delta}$ y ${\ Displaystyle \ sigma _ {z} = {\ sqrt {1- \ mu _ {z} ^ {2}}}}$

Estimacion

Estimaciones de máxima verosimilitud para ${\ Displaystyle \ xi}$ , ${\ Displaystyle \ omega}$ , y ${\ Displaystyle \ alpha}$ se puede calcular numéricamente, pero no se dispone de una expresión de forma cerrada para las estimaciones a menos que ${\ Displaystyle \ alpha = 0}$ . Si se necesita una expresión de forma cerrada, el método de momentos se puede aplicar para estimar ${\ Displaystyle \ alpha}$ del sesgo de la muestra, invirtiendo la ecuación de sesgo. Esto produce la estimación

{\ Displaystyle | \ delta | = {\ sqrt {{\ frac {\ pi} {2}} {\ frac {| {\ hat {\ gamma}} _ {1} | ^ {\ frac {2} {3 }}} {| {\ hat {\ gamma}} _ {1} | ^ {\ frac {2} {3}} + ((4- \ pi) / 2) ^ {\ frac {2} {3} }}}}}}

dónde ${\ Displaystyle \ delta = {\ frac {\ alpha} {\ sqrt {1+ \ alpha ^ {2}}}}}$ , y ${\ Displaystyle {\ hat {\ gamma}} _ {1}}$ es el sesgo de la muestra. El signo de ${\ Displaystyle \ delta}$ es el mismo que el signo de ${\ Displaystyle {\ hat {\ gamma}} _ {1}}$ . Como consecuencia, ${\ Displaystyle {\ hat {\ alpha}} = \ delta / {\ sqrt {1- \ delta ^ {2}}}}$ .

La asimetría máxima (teórica) se obtiene estableciendo ${\ Displaystyle {\ delta = 1}}$ en la ecuación de asimetría, dando ${\ Displaystyle \ gamma _ {1} \ aproximadamente 0,9952717}$ . Sin embargo, es posible que la asimetría de la muestra sea mayor, y luego ${\ Displaystyle \ alpha}$ no se puede determinar a partir de estas ecuaciones. Cuando se utiliza el método de momentos de forma automática, por ejemplo, para dar valores iniciales para la iteración de máxima verosimilitud, uno debe dejar (por ejemplo) ${\ Displaystyle | {\ hat {\ gamma}} _ {1} | = \ min (0,99, | (1 / n) \ sum {((x_ {i} - {\ bar {x}}) / s) ^ {3}} |)}$ .

Se ha expresado preocupación por el impacto de los métodos normales sesgados sobre la confiabilidad de las inferencias basadas en ellos. ^[8]

Distribuciones relacionadas

La distribución normal modificada exponencialmente es otra distribución de 3 parámetros que es una generalización de la distribución normal a casos asimétricos. El sesgo normal todavía tiene una cola similar a la normal en la dirección del sesgo, con una cola más corta en la otra dirección; es decir, su densidad es asintóticamente proporcional a ${\ Displaystyle e ^ {- kx ^ {2}}}$ por algo positivo ${\ Displaystyle k}$ . Por lo tanto, en términos de los siete estados de aleatoriedad , muestra una "aleatoriedad moderada adecuada". Por el contrario, la normal modificada exponencialmente tiene una cola exponencial en la dirección del sesgo; su densidad es asintóticamente proporcional a ${\ Displaystyle e ^ {- k | x |}}$ . En los mismos términos, muestra una "aleatoriedad moderada en el límite".

Por lo tanto, la normal de sesgo es útil para modelar distribuciones sesgadas que, sin embargo, no tienen más valores atípicos que la normal, mientras que la normal modificada exponencialmente es útil para casos con una mayor incidencia de valores atípicos en (solo) una dirección.

Implementación

Una implementación de la función de densidad, función de distribución, función de cuantiles y una función para generar desviaciones aleatorias está disponible para R en https://cran.r-project.org/web/packages/sn/index.html .

Ver también

Referencias

^ O'HAGAN, A .; LEONARD, TOM (1976). "Estimación de Bayes sujeta a incertidumbre sobre las limitaciones de los parámetros". Biometrika . 63 (1): 201–203. doi : 10.1093 / biomet / 63.1.201 . ISSN 0006-3444 .
^ Ashour, Samir K .; Abdel-hameed, Mahmood A. (octubre de 2010). "Distribución normal de sesgo aproximado" . Revista de investigación avanzada . 1 (4): 341–350. doi : 10.1016 / j.jare.2010.06.004 . ISSN 2090-1232 .
^ Mudholkar, Govind S .; Hutson, Alan D. (febrero de 2000). "La distribución epsilon-skew-normal para analizar datos casi normales". Revista de Planificación e Inferencia Estadística . 83 (2): 291-309. doi : 10.1016 / s0378-3758 (99) 00096-8 . ISSN 0378-3758 .
^ Andel, J., Netuka, I. y Zvara, K. (1984) Sobre procesos autorregresivos de umbral. Kybernetika, 20 años, 89-106
^ Chan, KS; Tong, H. (marzo de 1986). "Una nota sobre ciertas ecuaciones integrales asociadas con el análisis de series de tiempo no lineales". Teoría de la probabilidad y campos relacionados . 73 (1): 153-158. doi : 10.1007 / bf01845999 . ISSN 0178-8051 . S2CID 121106515 .
^ Azzalini, A. (1985). "Una clase de distribuciones que incluye las normales". Revista Escandinava de Estadística . 12 : 171-178.
^ Azzalini, Adelchi; Capitanio, Antonella (2014). Las familias sesgadas normales y relacionadas . págs. 32–33. ISBN 978-1-107-02927-9.
^ Pewsey, Arthur. "Problemas de inferencia para la distribución normal asimétrica de Azzalini". Revista de estadísticas aplicadas 27.7 (2000): 859-870

enlaces externos

La distribución normal de sesgo multivariable con una aplicación a la masa corporal, la altura y el índice de masa corporal
Una breve introducción a la distribución normal sesgada
La distribución de probabilidad oblicua-normal (y distribuciones relacionadas, como la oblicuidad-t)
OWENS: Función T de Owen
Distribuciones de sesgo cerrado: simulación, inversión y estimación de parámetros

[1] O'HAGAN, A .; LEONARD, TOM (1976). "Estimación de Bayes sujeta a incertidumbre sobre las limitaciones de los parámetros". Biometrika . 63 (1): 201–203. doi : 10.1093 / biomet / 63.1.201 . ISSN 0006-3444 .

[2] Ashour, Samir K .; Abdel-hameed, Mahmood A. (octubre de 2010). "Distribución normal de sesgo aproximado" . Revista de investigación avanzada . 1 (4): 341–350. doi : 10.1016 / j.jare.2010.06.004 . ISSN 2090-1232 .

[3] Mudholkar, Govind S .; Hutson, Alan D. (febrero de 2000). "La distribución epsilon-skew-normal para analizar datos casi normales". Revista de Planificación e Inferencia Estadística . 83 (2): 291-309. doi : 10.1016 / s0378-3758 (99) 00096-8 . ISSN 0378-3758 .

[4] Andel, J., Netuka, I. y Zvara, K. (1984) Sobre procesos autorregresivos de umbral. Kybernetika, 20 años, 89-106

[5] Chan, KS; Tong, H. (marzo de 1986). "Una nota sobre ciertas ecuaciones integrales asociadas con el análisis de series de tiempo no lineales". Teoría de la probabilidad y campos relacionados . 73 (1): 153-158. doi : 10.1007 / bf01845999 . ISSN 0178-8051 . S2CID 121106515 .

[Azzalini1985-6] Azzalini, A. (1985). "Una clase de distribuciones que incluye las normales". Revista Escandinava de Estadística . 12 : 171-178.

[Azzalini2014-7] Azzalini, Adelchi; Capitanio, Antonella (2014). Las familias sesgadas normales y relacionadas . págs. 32–33. ISBN 978-1-107-02927-9.

[8] Pewsey, Arthur. "Problemas de inferencia para la distribución normal asimétrica de Azzalini". Revista de estadísticas aplicadas 27.7 (2000): 859-870

[1]