En teoría de probabilidad y estadística , la distribución de valor extremo generalizado ( GEV ) es una familia de distribuciones de probabilidad continua desarrollada dentro de la teoría de valor extremo para combinar las familias de Gumbel , Fréchet y Weibull , también conocidas como distribuciones de valor extremo de tipo I, II y III. Según el teorema del valor extremo, la distribución GEV es la única distribución límite posible de los máximos correctamente normalizados de una secuencia de variables aleatorias independientes e idénticamente distribuidas. [2]Tenga en cuenta que debe existir una distribución límite, lo que requiere condiciones de regularidad en la cola de la distribución. A pesar de esto, la distribución GEV se usa a menudo como una aproximación para modelar los máximos de secuencias largas (finitas) de variables aleatorias.
En algunos campos de aplicación, la distribución generalizada de valores extremos se conoce como distribución de Fisher-Tippett , que lleva el nombre de Ronald Fisher y LHC Tippett, quienes reconocieron tres formas diferentes que se describen a continuación. Sin embargo, el uso de este nombre a veces se restringe para significar el caso especial de la distribución Gumbel . El origen de la forma funcional común para las 3 distribuciones se remonta al menos a Jenkinson, AF (1955), [3] aunque supuestamente [4] también podría haber sido dado por Mises, R. (1936). [5]
Especificación
Usando la variable estandarizada dónde el parámetro de ubicación, puede ser cualquier número real, y es el parámetro de escala; la función de distribución acumulada de la distribución GEV es entonces
dónde el parámetro de forma, puede ser cualquier número real. Por lo tanto, para, la expresión es válida para mientras que para es valido para En el primer caso, es el punto final inferior negativo, donde es 0; en el segundo caso, es el punto final superior positivo, donde es 1. Para la segunda expresión es formalmente indefinida y se reemplaza con la primera expresión, que es el resultado de tomar el límite de la segunda, como en ese caso puede ser cualquier número real.
En el caso especial de la media entonces y ≈ por los valores que sean y podría tener.
La función de densidad de probabilidad de la distribución estandarizada es
nuevamente válido para en el caso y para en el caso La densidad es cero fuera del rango relevante. En el caso la densidad es positiva en toda la línea real.
Dado que la función de distribución acumulativa es invertible, la función de cuantiles para la distribución GEV tiene una expresión explícita, a saber
y por lo tanto la función de densidad de cuantiles es
valido para y por cualquier real
Resumen estadístico
Algunas estadísticas simples de la distribución son: [ cita requerida ]
El parámetro de forma gobierna el comportamiento de cola de la distribución. Las subfamilias definidas por, y corresponden, respectivamente, a las familias Gumbel, Fréchet y Weibull, cuyas funciones de distribución acumulativa se muestran a continuación.
Fréchet o distribución de valor extremo tipo II, si y
Weibull invertido o distribución de valor extremo tipo III, si y
Las subsecciones siguientes comentan las propiedades de estas distribuciones.
Modificación para mínimos en lugar de máximos
La teoría aquí se relaciona con los datos máximos y la distribución que se está discutiendo es una distribución de valores extremos para los máximos. Se puede obtener una distribución de valores extremos generalizados para los mínimos de datos, por ejemplo, sustituyendo (- x ) por x en la función de distribución, y restando de uno: esto produce una familia separada de distribuciones.
Convención alternativa para la distribución de Weibull
La distribución de Weibull ordinaria surge en aplicaciones de confiabilidad y se obtiene de la distribución aquí usando la variable , que da un apoyo estrictamente positivo, en contraste con el uso en la teoría del valor extremo aquí. Esto surge porque la distribución de Weibull ordinaria se usa en casos que tratan con mínimos de datos en lugar de máximos de datos. La distribución aquí tiene un parámetro de adición en comparación con la forma habitual de la distribución de Weibull y, además, se invierte para que la distribución tenga un límite superior en lugar de un límite inferior. Es importante destacar que en las aplicaciones del GEV, el límite superior se desconoce y, por lo tanto, debe estimarse, mientras que cuando se aplica la distribución de Weibull ordinaria en aplicaciones de confiabilidad, el límite inferior generalmente se conoce como cero.
Rangos de las distribuciones
Tenga en cuenta las diferencias en los rangos de interés para las tres distribuciones de valores extremos: Gumbel es ilimitado, Fréchet tiene un límite inferior, mientras que el Weibull invertido tiene un límite superior. Más precisamente, la Teoría del Valor Extremo (Teoría Univariante) describe cuál de las tres es la ley limitante según la ley inicial X y en particular dependiendo de su cola.
Distribución de variables logarítmicas
Se puede vincular el tipo I a los tipos II y III de la siguiente manera: si la función de distribución acumulativa de alguna variable aleatoria es de tipo II, y con los números positivos como soporte, es decir , entonces la función de distribución acumulativa de es de tipo I, a saber . De manera similar, si la función de distribución acumulativa de es de tipo III, y con los números negativos como soporte, es decir , entonces la función de distribución acumulativa de es de tipo I, a saber .
Enlace a modelos logit (regresión logística)
Los modelos logit multinomiales , y algunos otros tipos de regresión logística , pueden expresarse como modelos de variables latentes con variables de error distribuidas como distribuciones de Gumbel (distribuciones de valores extremos generalizados de tipo I). Esta redacción es común en la teoría de los modelos de elección discreta , que incluyen modelos logit , modelos probit y varias extensiones de los mismos, y se deriva del hecho de que la diferencia de dos variables distribuidas por GEV de tipo I sigue una distribución logística , de las cuales la función logit es la función cuantil . Por tanto, la distribución GEV de tipo I juega el mismo papel en estos modelos logit que la distribución normal en los modelos probit correspondientes.
Propiedades
La función de distribución acumulada de la distribución de valores extremos generalizada resuelve la ecuación del postulado de estabilidad . [ cita requerida ] La distribución de valor extremo generalizada es un caso especial de una distribución máxima estable, y es una transformación de una distribución mínima estable.
Aplicaciones
La distribución GEV se utiliza ampliamente en el tratamiento de "riesgos de cola" en campos que van desde los seguros hasta las finanzas. En este último caso, se ha considerado como un medio para evaluar diversos riesgos financieros a través de métricas como el Valor en Riesgo . [6] [7]
Distribución de probabilidad de GEV ajustada a las precipitaciones máximas mensuales de un día en octubre, Surinam [8]
Sin embargo, se ha encontrado que los parámetros de forma resultantes se encuentran en el rango que conduce a medias y variaciones indefinidas, lo que subraya el hecho de que el análisis de datos confiable a menudo es imposible. [9]
En hidrología, la distribución de GEV se aplica a eventos extremos como las precipitaciones máximas anuales de un día y las descargas fluviales. La imagen azul, hecha con CumFreq , ilustra un ejemplo de cómo ajustar la distribución GEV a las precipitaciones máximas anuales clasificadas en un día, mostrando también el cinturón de confianza del 90% basado en la distribución binomial . Los datos de lluvia se representan mediante la representación de posiciones como parte del análisis de frecuencia acumulada .
Ejemplo de variables normalmente distribuidas
Dejar sean variables aleatorias distribuidas normalmente con media 0 y varianza 1. El teorema de Fisher-Tippett-Gnedenko nos dice que, dónde
.
Esto nos permite estimar, por ejemplo, la media de de la media de la distribución GEV:
Distribuciones relacionadas
Si luego
Si ( Distribución de Gumbel ) entonces
Si ( Distribución de Weibull ) entonces
Si luego ( Distribución de Weibull )
Si ( Distribución exponencial ) entonces
Si y luego (ver Distribución_logística ).
Si y luego (La suma no es una distribución logística). Tenga en cuenta que.
Pruebas
4. Deje , entonces la distribución acumulada de es:
cual es el CDF para .
5. Deja , entonces la distribución acumulada de es:
que es la distribución acumulada de .
Ver también
Teoría del valor extremo (teoría univariante)
Teorema de Fisher-Tippett-Gnedenko
Distribución de Pareto generalizada
Problema de los tanques alemanes , cuestión opuesta del máximo de población dado el máximo de muestra
Teorema de Pickands-Balkema-de Haan
Referencias
^ a b Muraleedharan. G, C. Guedes Soares y Cláudia Lucas (2011). "Funciones generadoras de características y momentos de la distribución generalizada de valores extremos (GEV)". En Linda. L. Wright (Ed.), Aumento del nivel del mar, ingeniería costera, costas y mareas , capítulo 14, págs. 269–276. Editorial Nova Science. ISBN 978-1-61728-655-1
^Haan, Laurens; Ferreira, Ana (2007). Teoría del valor extremo: una introducción . Saltador.
^Jenkinson, Arthur F (1955). "La distribución de frecuencias de los valores máximos (o mínimos) anuales de los elementos meteorológicos". Revista trimestral de la Royal Meteorological Society . 81 (348): 158-171. doi : 10.1002 / qj.49708134804 .
^Haan, Laurens; Ferreira, Ana (2007). Teoría del valor extremo: una introducción . Saltador.
^Mises, R. von. (1936). "La distribución de la plus grande de n valeurs". Rev. Math. Union Interbalcanique 1 : 141–160.
^ Moscadelli, Marco. "La modelización del riesgo operacional: experiencia con el análisis de los datos recopilados por el Comité de Basilea". Disponible en SSRN 557214 (2004).
^Guégan, D .; Hassani, BK (2014), "Un resurgimiento matemático de la gestión de riesgos: un modelo extremo de opiniones de expertos", Frontiers in Finance and Economics , 11 (1): 25–45, SSRN 2558747
^ CumFreq para el ajuste de distribución de probabilidad [1]
^ Kjersti Aas, conferencia, NTNU, Trondheim, 23 de enero de 2008
Otras lecturas
Embrechts, Paul; Klüppelberg, Claudia ; Mikosch, Thomas (1997). Modelado de eventos extremos para seguros y finanzas . Berlín: Springer Verlag. ISBN 9783540609315.
Leadbetter, MR, Lindgren, G. y Rootzén, H. (1983). Extremos y propiedades relacionadas de secuencias y procesos aleatorios . Springer-Verlag. ISBN 0-387-90731-9.CS1 maint: varios nombres: lista de autores ( enlace )
Resnick, SI (1987). Valores extremos, variación regular y procesos puntuales . Springer-Verlag. ISBN 0-387-96481-9.
Coles, Stuart (2001). Introducción al modelado estadístico de valores extremos . Springer-Verlag. ISBN 1-85233-459-2.