En estadística , la distribución de Pareto generalizada (GPD) es una familia de distribuciones de probabilidad continua . A menudo se utiliza para modelar las colas de otra distribución. Se especifica mediante tres parámetros: ubicación, escala y forma . [1] [2] A veces se especifica solo por la escala y la forma [3] y, a veces, solo por su parámetro de forma. Algunas referencias dan el parámetro de forma como. [4]
Distribución de Pareto generalizada
Función de densidad de probabilidad
Funciones de distribución GPD para y diferentes valores de y
Ambas fórmulas se obtienen por inversión de la CDF.
En Matlab Statistics Toolbox, puede usar fácilmente el comando "gprnd" para generar números aleatorios de Pareto generalizados.
GPD como una mezcla exponencial-gamma
Una variable aleatoria GPD también se puede expresar como una variable aleatoria exponencial, con un parámetro de tasa distribuida Gamma.
y
luego
Sin embargo, observe que dado que los parámetros para la distribución Gamma deben ser mayores que cero, obtenemos las restricciones adicionales que: debe ser positivo.
Distribución de Pareto generalizada exponencial
La distribución de Pareto generalizada exponencializada (exGPD)
El pdf de la (distribución de Pareto generalizada exponencializada) para diferentes valores y .
Para todos , la se convierte en el parámetro de ubicación. Consulte el panel de la derecha para ver el pdf cuando la forma es positivo.
El exGPD tiene momentos finitos de todos los pedidos para todos y .
La varianza de la como una función de . Tenga en cuenta que la varianza solo depende de . La línea de puntos roja representa la varianza evaluada en , es decir, .
Consulte el panel de la derecha para ver la varianza en función de . Tenga en cuenta que.
Tenga en cuenta que los roles del parámetro de escala y el parámetro de forma debajo son interpretables separadamente, lo que puede conducir a una estimación robusta y eficiente para el que usar el [2] . Los roles de los dos parámetros están asociados entre sí bajo(al menos hasta el segundo momento central); ver la fórmula de varianza en el que participan ambos parámetros.
El estimador de Hill
Asumir que están observaciones (no es necesario que sean iid) de una distribución de cola pesada desconocida tal que su distribución de cola varía regularmente con el índice de cola (por lo tanto, el parámetro de forma correspondiente es ). Para ser específico, la distribución de la cola se describe como
Es de particular interés en la teoría del valor extremo estimar el parámetro de forma, especialmente cuando es positivo (la denominada distribución de cola pesada).
Dejar sea su función de distribución de exceso condicional. El teorema de Pickands-Balkema-de Haan (Pickands, 1975; Balkema y de Haan, 1974) establece que para una gran clase de funciones de distribución subyacentes, y largo , está bien aproximada por la distribución de Pareto generalizada (GPD), que motivó a los métodos Peak Over Threshold (POT) para estimar : el GPD juega un papel clave en el enfoque de POT.
Un estimador de renombre que utiliza la metodología POT es el estimador de Hill . La formulación técnica del estimador de Hill es la siguiente. Para, escribir Para el -ésimo valor más grande de . Luego, con esta notación, el estimador de Hill (ver la página 190 de la Referencia 5 de Embrechts et al [3] ) basado en el las estadísticas de orden superior se definen como
En la práctica, el estimador de Hill se utiliza de la siguiente manera. Primero, calcula el estimador en cada entero , y luego trazar los pares ordenados . Luego, seleccione del conjunto de estimadores de Hill que son aproximadamente constantes con respecto a : estos valores estables se consideran estimaciones razonables para el parámetro de forma . Si son iid, entonces el estimador de Hill es un estimador consistente para el parámetro de forma [4] .
Tenga en cuenta que el estimador de Hill hace uso de la transformación logarítmica para las observaciones . (El estimador de Pickandtambién empleó la transformación logarítmica, pero de una manera ligeramente diferente [5] .)
Ver también
Distribución de rebabas
Distribución de Pareto
Distribución generalizada de valores extremos
Distribución de Pareto generalizada exponencial
Teorema de Pickands-Balkema-de Haan
Referencias
↑ Coles, Stuart (12 de diciembre de 2001). Introducción al modelado estadístico de valores extremos . Saltador. pag. 75. ISBN 9781852334598.
^Dargahi-Noubary, GR (1989). "En la estimación de la cola: un método mejorado". Geología matemática . 21 (8): 829–842. doi : 10.1007 / BF00894450 . S2CID 122710961 .
^Hosking, JRM; Wallis, JR (1987). "Estimación de parámetros y cuantiles para la distribución de Pareto generalizada". Tecnometría . 29 (3): 339–349. doi : 10.2307 / 1269343 . JSTOR 1269343 .
^Davison, AC (30 de septiembre de 1984). "Modelado de excesos sobre umbrales altos, con una aplicación" . En de Oliveira, J. Tiago (ed.). Extremos estadísticos y aplicaciones . Kluwer. pag. 462. ISBN 9789027718044.
^Embrechts, Paul; Klüppelberg, Claudia ; Mikosch, Thomas (1 de enero de 1997). Modelado de eventos extremos para seguros y finanzas . pag. 162. ISBN 9783540609315.
Otras lecturas
Pickands, James (1975). "Inferencia estadística utilizando estadísticas de orden extremo" . Annals of Statistics . 3 s : 119-131. doi : 10.1214 / aos / 1176343003 .
Balkema, A .; De Haan, Laurens (1974). "Tiempo de vida residual a gran edad" . Anales de probabilidad . 2 (5): 792–804. doi : 10.1214 / aop / 1176996548 .
Lee, Seyoon; Kim, JHK (2018). "Distribución de Pareto generalizada exponencial: propiedades y aplicaciones hacia la teoría del valor extremo". Comunicaciones en estadística: teoría y métodos . 48 (8): 1–25. arXiv : 1708.01686 . doi : 10.1080 / 03610926.2018.1441418 . S2CID 88514574 .
NL Johnson; S. Kotz; N. Balakrishnan (1994). Distribuciones univariadas continuas Volumen 1, segunda edición . Nueva York: Wiley. ISBN 978-0-471-58495-7. Capítulo 20, Sección 12: Distribuciones de Pareto generalizadas.
Barry C. Arnold (2011). "Capítulo 7: Pareto y distribuciones de Pareto generalizadas" . En Duangkamon Chotikapanich (ed.). Modelado de distribuciones y curvas de Lorenz . Nueva York: Springer. ISBN 9780387727967.
Arnold, BC; Laguna, L. (1977). Sobre distribuciones de Pareto generalizadas con aplicaciones a datos de ingresos . Ames, Iowa: Universidad Estatal de Iowa, Departamento de Economía.