Distribución de Gumbel

En teoría de probabilidad y estadística , la distribución de Gumbel (distribución de valor extremo generalizado Tipo-I) se utiliza para modelar la distribución del máximo (o el mínimo) de un número de muestras de varias distribuciones.

Gumbel
Función de densidad de probabilidad
Función de distribución acumulativa
Parámetros	${\ Displaystyle \ mu,}$ ubicación ( real ) ${\ Displaystyle \ beta> 0,}$ escala (real)
Apoyo	${\ Displaystyle x \ in \ mathbb {R}}$
PDF	${\ Displaystyle {\ frac {1} {\ beta}} e ^ {(ze ^ {z})}}$ dónde ${\ Displaystyle z = {\ frac {x- \ mu} {\ beta}}}$
CDF	${\ displaystyle 1-e ^ {- e ^ {- (x- \ mu) / \ beta}}}$
Significar	${\ Displaystyle \ mu + \ beta \ gamma}$ dónde ${\ Displaystyle \ gamma}$ es la constante de Euler-Mascheroni
Mediana	${\ Displaystyle \ mu - \ beta \ ln (\ ln 2)}$
Modo	${\ Displaystyle \ mu}$
Diferencia	${\ Displaystyle {\ frac {\ pi ^ {2}} {6}} \ beta ^ {2}}$
Oblicuidad	${\ Displaystyle {\ frac {12 {\ sqrt {6}} \, \ zeta (3)} {\ pi ^ {3}}} \ approx 1,14}$
Ex. curtosis	${\ Displaystyle {\ frac {12} {5}}}$
Entropía	${\ Displaystyle \ ln (\ beta) + \ gamma +1}$
MGF	${\ Displaystyle \ Gamma (1- \ beta t) e ^ {\ mu t}}$
CF	${\ Displaystyle \ Gamma (1-i \ beta t) e ^ {i \ mu t}}$

Esta distribución podría usarse para representar la distribución del nivel máximo de un río en un año en particular si hubiera una lista de valores máximos para los últimos diez años. Es útil para predecir la posibilidad de que ocurra un terremoto extremo, una inundación u otro desastre natural. La aplicabilidad potencial de la distribución de Gumbel para representar la distribución de máximos se relaciona con la teoría del valor extremo , que indica que es probable que sea útil si la distribución de los datos muestrales subyacentes es de tipo normal o exponencial. Este artículo utiliza la distribución de Gumbel para modelar la distribución del valor máximo . Para modelar el valor mínimo, use el negativo de los valores originales.

La distribución de Gumbel es un caso particular de la distribución de valor extremo generalizada (también conocida como distribución de Fisher-Tippett). También se conoce como distribución log- Weibull y distribución doble exponencial (un término que se usa alternativamente a veces para referirse a la distribución de Laplace ). Está relacionado con la distribución de Gompertz : cuando su densidad se refleja primero sobre el origen y luego se restringe a la línea media positiva, se obtiene una función de Gompertz.

En la formulación de variables latentes del modelo logit multinomial , común en la teoría de la elección discreta , los errores de las variables latentes siguen una distribución de Gumbel. Esto es útil porque la diferencia de dos variables aleatorias distribuidas por Gumbel tiene una distribución logística .

La distribución de Gumbel lleva el nombre de Emil Julius Gumbel (1891-1966), según sus artículos originales que describen la distribución. ^[1]^[2]

Definiciones

La función de distribución acumulativa de la distribución de Gumbel es

{\ Displaystyle F (x; \ mu, \ beta) = e ^ {- e ^ {- (x- \ mu) / \ beta}}. \,}

Distribución estándar de Gumbel

La distribución estándar de Gumbel es el caso donde ${\ Displaystyle \ mu = 0}$ y ${\ Displaystyle \ beta = 1}$ con función de distribución acumulativa

{\ Displaystyle F (x) = e ^ {- e ^ {(- x)}} \,}

y función de densidad de probabilidad

{\ Displaystyle f (x) = e ^ {- (x + e ^ {- x})}.}

En este caso, la moda es 0, la mediana es ${\ Displaystyle - \ ln (\ ln (2)) \ approx 0.3665}$ , la media es ${\ Displaystyle \ gamma \ aproximadamente 0,5772}$ (la constante de Euler-Mascheroni ), y la desviación estándar es ${\ Displaystyle \ pi / {\ sqrt {6}} \ aproximadamente 1,2825.}$

Los acumulados, para n> 1, están dados por

{\ Displaystyle \ kappa _ {n} = (n-1)! \ zeta (n).}

Propiedades

La moda es μ, mientras que la mediana es ${\ Displaystyle \ mu - \ beta \ ln \ left (\ ln 2 \ right),}$ y la media viene dada por

{\ Displaystyle \ operatorname {E} (X) = \ mu + \ gamma \ beta}

,

dónde ${\ Displaystyle \ gamma}$ es la constante de Euler-Mascheroni .

La desviación estándar ${\ Displaystyle \ sigma}$ es ${\ Displaystyle \ beta \ pi / {\ sqrt {6}}}$ por eso ${\ Displaystyle \ beta = \ sigma {\ sqrt {6}} / \ pi \ approx 0,78 \ sigma.}$ ^[3]

En el modo, donde ${\ Displaystyle x = \ mu}$ , El valor de ${\ Displaystyle F (x; \ mu, \ beta)}$ se convierte en ${\ Displaystyle e ^ {- 1} \ aproximadamente 0,37}$ , independientemente del valor de ${\ Displaystyle \ beta.}$

Distribuciones relacionadas

Si ${\ Displaystyle X}$ tiene una distribución de Gumbel, entonces la distribución condicional de Y = −X dado que Y es positivo, o equivalentemente dado que X es negativo, tiene una distribución de Gompertz . La CDF G de Y está relacionada con F , la CDF de X , por la fórmula ${\ Displaystyle G (y) = P (Y \ leq y) = P (X \ geq -y | X \ leq 0) = (F (0) -F (-y)) / F (0)}$ para y > 0. En consecuencia, las densidades están relacionadas por ${\ Displaystyle g (y) = f (-y) / F (0)}$ : la densidad de Gompertz es proporcional a una densidad de Gumbel reflejada, restringida a la media línea positiva. ^[4]
Si X es una variable distribuida exponencialmente con media 1, entonces −log ( X ) tiene una distribución de Gumbel estándar.
Si ${\ Displaystyle X \ sim \ mathrm {Gumbel} (\ alpha _ {X}, \ beta)}$ y ${\ Displaystyle Y \ sim \ mathrm {Gumbel} (\ alpha _ {Y}, \ beta)}$ son independientes, entonces ${\ Displaystyle XY \ sim \ mathrm {Logística} (\ alpha _ {X} - \ alpha _ {Y}, \ beta) \,}$ (ver Distribución logística ).
Si ${\ Displaystyle X, Y \ sim \ mathrm {Gumbel} (\ alpha, \ beta)}$ son independientes, entonces ${\ Displaystyle X + Y \ nsim \ mathrm {Logística} (2 \ alpha, \ beta)}$ . Tenga en cuenta que ${\ displaystyle E (X + Y) = 2 \ alpha +2 \ beta \ gamma \ neq 2 \ alpha = E \ left (\ mathrm {Logistic} (2 \ alpha, \ beta) \ right)}$ .

La teoría relacionada con la distribución log-gamma multivariada generalizada proporciona una versión multivariante de la distribución de Gumbel.

Ocurrencia y aplicaciones

Distribución ajustada con banda de confianza de una distribución acumulada de Gumbel a las precipitaciones máximas de un día de octubre. ^[5]

Gumbel ha demostrado que el valor máximo (o estadístico de último orden ) en una muestra de una variable aleatoria que sigue una distribución exponencial menos el logaritmo natural del tamaño de la muestra ^{[6] se} acerca más a la distribución de Gumbel al aumentar el tamaño de la muestra. ^[7]

En hidrología , por lo tanto, la distribución de Gumbel se utiliza para analizar variables tales como los valores máximos mensuales y anuales de las precipitaciones diarias y los volúmenes de descarga de los ríos, ^[3] y también para describir las sequías. ^[8]

Gumbel también ha demostrado que el estimador r ⁄ ( n +1) para la probabilidad de un evento, donde r es el número de rango del valor observado en la serie de datos yn es el número total de observaciones, es un estimador insesgado de la probabilidad acumulada en torno a la moda de la distribución. Por lo tanto, este estimador se utiliza a menudo como posición de trazado .

En teoría de números , la distribución de Gumbel se aproxima al número de términos en una partición aleatoria de un entero ^[9] , así como los tamaños ajustados por tendencia de los espacios primos máximos y los espacios máximos entre constelaciones primarias . ^[10]

En el aprendizaje automático , la distribución de Gumbel a veces se emplea para generar muestras a partir de la distribución categórica . ^[11]

Métodos computacionales

Papel de probabilidad

Un trozo de papel cuadriculado que incorpora la distribución de Gumbel.

En tiempos anteriores al software, se utilizó papel de probabilidad para representar la distribución de Gumbel (ver ilustración). El artículo se basa en la linealización de la función de distribución acumulativa. ${\ Displaystyle F}$ :

{\ Displaystyle - \ ln [- \ ln (F)] = (x- \ mu) / \ beta}

En el documento, el eje horizontal se construye a una escala logarítmica doble. El eje vertical es lineal. Trazando ${\ Displaystyle F}$ en el eje horizontal del papel y el ${\ Displaystyle x}$ -variable en el eje vertical, la distribución está representada por una línea recta con pendiente 1 ${\ Displaystyle / \ beta}$ . Cuando estuvo disponible un software de ajuste de distribución como CumFreq , la tarea de trazar la distribución se hizo más fácil, como se demuestra en la sección siguiente.

Generando variantes de Gumbel

Dado que la función cuantil ( función de distribución acumulativa inversa ), ${\ Displaystyle Q (p)}$ , de una distribución de Gumbel está dada por

{\ Displaystyle Q (p) = \ mu - \ beta \ ln (- \ ln (p)),}

la variada ${\ Displaystyle Q (U)}$ tiene una distribución de Gumbel con parámetros ${\ Displaystyle \ mu}$ y ${\ Displaystyle \ beta}$ cuando la variante aleatoria ${\ Displaystyle U}$ se extrae de la distribución uniforme en el intervalo ${\ Displaystyle (0,1)}$ .

Ver también

Distribución de Gumbel tipo 1
Distribución de Gumbel tipo 2
Teoría del valor extremo
Distribución generalizada de valores extremos
Teorema de Fisher-Tippett-Gnedenko
Emil Julius Gumbel

Referencias

^ Gumbel, EJ (1935), "Les valeurs extrêmes des distributions statistiques" (PDF) , Annales de l'Institut Henri Poincaré , 5 (2): 115-158
^ Gumbel EJ (1941). "El período de retorno de los flujos de inundaciones". The Annals of Mathematical Statistics, 12, 163-190.
^ a b Oosterbaan, RJ (1994). "Capítulo 6 Análisis de frecuencia y regresión" (PDF) . En Ritzema, HP (ed.). Principios y aplicaciones de drenaje, publicación 16 . Wageningen, Países Bajos: Instituto Internacional para la Recuperación y Mejoramiento de Tierras (ILRI). págs. 175–224 . ISBN 90-70754-33-9.
^ Willemse, WJ; Kaas, R. (2007). "Reconstrucción racional de modelos de mortalidad basados en la fragilidad mediante una generalización de la ley de mortalidad de Gompertz" (PDF) . Seguros: Matemáticas y Economía . 40 (3): 468. doi : 10.1016 / j.insmatheco.2006.07.003 .
^ CumFreq, software para el ajuste de distribución de probabilidad
^ [ https://math.stackexchange.com/questions/3527556/gumbel-distribution-and-exponential-distribution?noredirect=1#comment7669633_3527556 user49229, distribución de Gumbel y distribución exponencial]
^ Gumbel, EJ (1954). Teoría estadística de valores extremos y algunas aplicaciones prácticas . Serie de Matemáticas Aplicadas. 33 (1ª ed.). Departamento de Comercio de EE. UU., Oficina Nacional de Normas. ASIN B0007DSHG4 .
^ Burke, Eleanor J .; Perry, Richard HJ; Brown, Simon J. (2010). "Un análisis de valor extremo de la sequía del Reino Unido y proyecciones de cambio en el futuro". Revista de hidrología . 388 (1–2): 131–143. Código bibliográfico : 2010JHyd..388..131B . doi : 10.1016 / j.jhydrol.2010.04.035 .
^ Erdös, Paul; Lehner, Joseph (1941). "La distribución del número de sumandos en las particiones de un entero positivo". Diario de matemáticas de Duke . 8 (2): 335. doi : 10.1215 / S0012-7094-41-00826-8 .
^ Kourbatov, A. (2013). "Brechas máximas entre k-tuplas primos: un enfoque estadístico". Diario de secuencias de enteros . 16 . arXiv : 1301.2242 . Código bibliográfico : 2013arXiv1301.2242K . Artículo 13.5.2.
^ Adams, Ryan. "El truco de Gumbel-Max para distribuciones discretas" .

enlaces externos

[1] Gumbel, EJ (1935), "Les valeurs extrêmes des distributions statistiques" (PDF) , Annales de l'Institut Henri Poincaré , 5 (2): 115-158

[2] Gumbel EJ (1941). "El período de retorno de los flujos de inundaciones". The Annals of Mathematical Statistics, 12, 163-190.

[Oosterbaan-3] Oosterbaan, RJ (1994). "Capítulo 6 Análisis de frecuencia y regresión" (PDF) . En Ritzema, HP (ed.). Principios y aplicaciones de drenaje, publicación 16 . Wageningen, Países Bajos: Instituto Internacional para la Recuperación y Mejoramiento de Tierras (ILRI). págs. 175–224 . ISBN 90-70754-33-9.

[4] Willemse, WJ; Kaas, R. (2007). "Reconstrucción racional de modelos de mortalidad basados en la fragilidad mediante una generalización de la ley de mortalidad de Gompertz" (PDF) . Seguros: Matemáticas y Economía . 40 (3): 468. doi : 10.1016 / j.insmatheco.2006.07.003 .

[5] CumFreq, software para el ajuste de distribución de probabilidad

[6] [ https://math.stackexchange.com/questions/3527556/gumbel-distribution-and-exponential-distribution?noredirect=1#comment7669633_3527556 user49229, distribución de Gumbel y distribución exponencial]

[7] Gumbel, EJ (1954). Teoría estadística de valores extremos y algunas aplicaciones prácticas . Serie de Matemáticas Aplicadas. 33 (1ª ed.). Departamento de Comercio de EE. UU., Oficina Nacional de Normas. ASIN B0007DSHG4 .

[8] Burke, Eleanor J .; Perry, Richard HJ; Brown, Simon J. (2010). "Un análisis de valor extremo de la sequía del Reino Unido y proyecciones de cambio en el futuro". Revista de hidrología . 388 (1–2): 131–143. Código bibliográfico : 2010JHyd..388..131B . doi : 10.1016 / j.jhydrol.2010.04.035 .

[9] Erdös, Paul; Lehner, Joseph (1941). "La distribución del número de sumandos en las particiones de un entero positivo". Diario de matemáticas de Duke . 8 (2): 335. doi : 10.1215 / S0012-7094-41-00826-8 .

[10] Kourbatov, A. (2013). "Brechas máximas entre k-tuplas primos: un enfoque estadístico". Diario de secuencias de enteros . 16 . arXiv : 1301.2242 . Código bibliográfico : 2013arXiv1301.2242K . Artículo 13.5.2.

[11] Adams, Ryan. "El truco de Gumbel-Max para distribuciones discretas" .

[1]