Teoría del valor extremo


De Wikipedia, la enciclopedia libre
  (Redirigido desde un evento raro )
Saltar a navegación Saltar a búsqueda
La teoría de valores extremos se utiliza para modelar el riesgo de eventos extremos y raros, como el terremoto de Lisboa de 1755 .

La teoría de valores extremos o análisis de valores extremos ( EVA ) es una rama de la estadística que se ocupa de las desviaciones extremas de la mediana de las distribuciones de probabilidad . Busca evaluar, a partir de una muestra ordenada dada de una variable aleatoria dada, la probabilidad de eventos que son más extremos que cualquiera de los observados previamente. El análisis de valor extremo se usa ampliamente en muchas disciplinas, como ingeniería estructural , finanzas, ciencias de la tierra , predicción de tráfico e ingeniería geológica . Por ejemplo, EVA podría usarse en el campo de la hidrología.para estimar la probabilidad de una inundación inusualmente grande, como la inundación de 100 años . De manera similar, para el diseño de un rompeolas , un ingeniero costero buscaría estimar la ola de 50 años y diseñar la estructura en consecuencia.

Análisis de los datos

Existen dos enfoques principales para el análisis práctico de valores extremos.

El primer método se basa en derivar series de máximos (mínimos) de bloque como paso preliminar. En muchas situaciones es habitual y conveniente extraer los máximos (mínimos) anuales, generando una "Serie de Máximos Anuales" (AMS).

El segundo método se basa en extraer, de un registro continuo, los valores máximos alcanzados para cualquier período durante el cual los valores exceden un cierto umbral (cae por debajo de un cierto umbral). Este método se conoce generalmente como el método "Peak Over Threshold" [1] (POT).

Para los datos de AMS, el análisis puede depender en parte de los resultados del teorema de Fisher-Tippett-Gnedenko , lo que lleva a seleccionar la distribución de valores extremos generalizados para el ajuste. [2] [3] Sin embargo, en la práctica, se aplican varios procedimientos para seleccionar entre una gama más amplia de distribuciones. El teorema aquí se relaciona con las distribuciones límite para el mínimo o el máximo de una colección muy grande de variables aleatorias independientes de la misma distribución. Dado que el número de eventos aleatorios relevantes dentro de un año puede ser bastante limitado, no es sorprendente que los análisis de los datos de AMS observados a menudo conduzcan a la selección de distribuciones distintas de la distribución generalizada de valores extremos (GEVD).[4]

Para los datos de POT, el análisis puede implicar el ajuste de dos distribuciones: una para el número de eventos en un período de tiempo considerado y una segunda para el tamaño de las superaciones.

Un supuesto común para el primero es la distribución de Poisson , con la distribución de Pareto generalizada que se utiliza para las superaciones. Un ajuste de cola se puede basar en el teorema de Pickands-Balkema-de Haan . [5] [6]

Novak [7] reserva el término "método POT" para el caso en el que el umbral no es aleatorio, y lo distingue del caso en el que se trata de superaciones de un umbral aleatorio.

Aplicaciones

Las aplicaciones de la teoría de valores extremos incluyen la predicción de la distribución de probabilidad de:

  • Inundaciones extremas ; El tamaño de las olas monstruosas
  • Tornado brotes [8]
  • Tamaños máximos de poblaciones ecológicas [9]
  • Efectos secundarios de los medicamentos (p. Ej., Ximelagatran )
  • Los montos de grandes pérdidas de seguros
  • Riesgos patrimoniales ; Riesgo de mercado diario
  • Eventos mutacionales durante la evolución
  • Grandes incendios forestales [10]
  • Cargas ambientales en estructuras [11]
  • Estimar el tiempo más rápido que los humanos son capaces de correr los 100 metros de velocidad [12] y desempeñarse en otras disciplinas atléticas [13] [14].
  • Fallos en las tuberías debido a la corrosión por picaduras
  • Tráfico de red de TI anómalo, evita que los atacantes accedan a datos importantes
  • Análisis de seguridad vial [15] [16]
  • Comunicaciones inalámbricas [17]
  • Epidemias [18]
  • Neurobiología [19]

Historia

Leonard Tippett (1902-1985) fue pionero en el campo de la teoría del valor extremo . Tippett fue empleado de la Asociación Británica de Investigación de la Industria del Algodón , donde trabajó para fortalecer el hilo de algodón. En sus estudios, se dio cuenta de que la fuerza de un hilo estaba controlada por la fuerza de sus fibras más débiles. Con la ayuda de RA Fisher , Tippet obtuvo tres límites asintóticos que describen las distribuciones de extremos asumiendo variables independientes. Emil Julius Gumbel codificó esta teoría en su libro Statistics of Extremes de 1958 , incluidas las distribuciones de Gumbel.que llevan su nombre. Estos resultados pueden extenderse para permitir correlaciones leves entre variables, pero la teoría clásica no se extiende a correlaciones fuertes del orden de la varianza. Una clase de universalidad de particular interés es la de los campos con correlación logarítmica, donde las correlaciones decaen logarítmicamente con la distancia.

Se puede encontrar un resumen de publicaciones históricamente importantes relacionadas con la teoría de los valores extremos en la Lista de publicaciones en estadística .

Teoría univariante

Sea una secuencia de variables aleatorias independientes e idénticamente distribuidas con función de distribución acumulativa F y denotemos el máximo.

En teoría, la distribución exacta del máximo se puede derivar:

La función indicadora asociada es un proceso de Bernoulli con una probabilidad de éxito que depende de la magnitud del evento extremo. Por lo tanto, el número de eventos extremos dentro de los ensayos sigue una distribución binomial y el número de ensayos hasta que ocurre un evento sigue una distribución geométrica con valor esperado y desviación estándar del mismo orden .

En la práctica, es posible que no tengamos la función de distribución, pero el teorema de Fisher-Tippett-Gnedenko proporciona un resultado asintótico. Si existen secuencias de constantes y tales que

como entonces

donde depende de la forma de la cola de la distribución. Cuando se normaliza, G pertenece a una de las siguientes familias de distribución no degeneradas :

Ley de Weibull : cuando la distribución de tiene una cola ligera con límite superior finito. También conocido como Tipo 3.

Ley de Gumbel : cuando la distribución de tiene una cola exponencial. También conocido como Tipo 1

Ley de Fréchet : cuando la distribución de tiene una cola pesada (incluida la desintegración polinomial). También conocido como Tipo 2.

En todos los casos, .

Teoría multivariante

La teoría del valor extremo en más de una variable introduce problemas adicionales que deben abordarse. Un problema que surge es que hay que especificar qué constituye un evento extremo. [20] Aunque esto es sencillo en el caso univariante, no hay una manera inequívoca de hacerlo en el caso multivariado. El problema fundamental es que, aunque es posible ordenar un conjunto de números con valores reales, no existe una forma natural de ordenar un conjunto de vectores.

Por ejemplo, en el caso univariado, dado un conjunto de observaciones , es sencillo encontrar el evento más extremo simplemente tomando el máximo (o mínimo) de las observaciones. Sin embargo, en el caso bivariado, dado un conjunto de observaciones , no está claro de inmediato cómo encontrar el evento más extremo. Suponga que uno ha medido los valores en un momento específico y los valores en un momento posterior. ¿Cuál de estos eventos se consideraría más extremo? No existe una respuesta universal a esta pregunta.

Otro problema en el caso multivariado es que el modelo limitante no está tan completamente prescrito como en el caso univariado. En el caso univariado, el modelo ( distribución GEV ) contiene tres parámetros cuyos valores no son predichos por la teoría y deben obtenerse ajustando la distribución a los datos. En el caso multivariado, el modelo no solo contiene parámetros desconocidos, sino también una función cuya forma exacta no está prescrita por la teoría. Sin embargo, esta función debe obedecer a ciertas restricciones. [21] [22]

Como ejemplo de una aplicación, la teoría de valores extremos bivariados se ha aplicado a la investigación oceánica. [20] [23]

Ver también

  • Riesgo extremo
  • Clima extremo
  • Teorema de Fisher-Tippett-Gnedenko
  • Distribución generalizada de valores extremos
  • Teoría de la gran desviación
  • Parte aislada
  • Distribución de Pareto
  • Teorema de Pickands-Balkema-de Haan
  • Eventos raros
  • Distribución de Weibull
  • Principio de redundancia

Notas

  1. ^ Leadbetter, señor (1991). "Sobre la base del modelado de 'Picos por encima del umbral'". Estadísticas y letras de probabilidad . 12 (4): 357–362. doi : 10.1016 / 0167-7152 (91) 90107-3 .
  2. ^ Fisher y Tippett (1928)
  3. Gnedenko (1943)
  4. ^ Embrechts, Klüppelberg y Mikosch (1997)
  5. Pickands (1975)
  6. ^ Balkema y de Haan (1974)
  7. Novak (2011)
  8. ^ Tippett, Michael K .; Lepore, Chiara; Cohen, Joel E. (16 de diciembre de 2016). "Más tornados en los brotes de tornados más extremos de Estados Unidos" . Ciencia . 354 (6318): 1419–1423. doi : 10.1126 / science.aah7393 . PMID 27934705 . 
  9. ^ Batt, Ryan D .; Carpenter, Stephen R .; Ives, Anthony R. (marzo de 2017). "Eventos extremos en series de tiempo del ecosistema del lago" . Letras de limnología y oceanografía . 2 (3): 63. doi : 10.1002 / lol2.10037 .
  10. Alvardo (1998, p. 68).
  11. ^ Makkonen (2008)
  12. ^ JHJ Einmahl y SGWR Smeets (2009), "Ultimate 100m Records mundo a través de Extreme-Teoría del Valor" (PDF) , Documento de debate Center, Universidad de Tilburg , 57 , Archivado desde el original (PDF) en 12/03/2016 , obtenidos 2009 -08-12 Mantenimiento de CS1: utiliza el parámetro de autores ( enlace )
  13. ^ D. Gembris, J.Taylor & D. Suter (2002), "Tendencias y fluctuaciones aleatorias en el atletismo", Nature , 417 (6888): 506, Bibcode : 2002Natur.417..506G , doi : 10.1038 / 417506a , hdl : 2003/25362 , PMID 12037557 , S2CID 13469470  Mantenimiento de CS1: utiliza el parámetro de autores ( enlace )
  14. ^ D. Gembris, J.Taylor & D. Suter (2007), "Evolución de los registros deportivos: efectos estadísticos frente a mejoras reales", Journal of Applied Statistics , 34 (5): 529–545, doi : 10.1080 / 02664760701234850 , hdl : 2003/25404 , S2CID 55378036 Mantenimiento de CS1: utiliza el parámetro de autores ( enlace )
  15. ^ Songchitruksa, P .; Tarko, AP (2006). "El enfoque de la teoría del valor extremo para la estimación de la seguridad". Análisis y prevención de accidentes . 38 (4): 811–822. doi : 10.1016 / j.aap.2006.02.003 . PMID 16546103 . 
  16. Orsini, F .; Gecchele, G .; Gastaldi, M .; Rossi, R. (2019). "Predicción de colisiones en rotondas: un estudio comparativo de enfoques de teoría de valor extremo". Transportmetrica A: Ciencia del Transporte . 15 (2): 556–572. doi : 10.1080 / 23249935.2018.1515271 . S2CID 158343873 . 
  17. ^ CG Tsinos, F. Foukalas, T. Khattab y L. Lai, " Sobre la selección de canales para sistemas de agregación de portadores ". IEEE Transactions on Communications, vol. 66, no. 2, febrero de 2018) 808-818.
  18. ^ Wong, Felix; Collins, James J. (2 de noviembre de 2020). "La evidencia de que la superpropagación del coronavirus tiene una cola gruesa" . Actas de la Academia Nacional de Ciencias . 117 (47): 29416–29418. Código Bib : 2020PNAS..11729416W . doi : 10.1073 / pnas.2018490117 . ISSN 0027-8424 . PMC 7703634 . PMID 33139561 .   
  19. ^ Basnayake, Kanishka; Mazaud, David; Bemelmans, Alexis; Rouach, Nathalie; Korkotian, Eduard; Holcman, David (4 de junio de 2019). "Transitorios rápidos de calcio en espinas dendríticas impulsados ​​por estadísticas extremas" . PLOS Biología . 17 (6): e2006202. doi : 10.1371 / journal.pbio.2006202 . ISSN 1545-7885 . PMC 6548358 .  
  20. ^ a b Morton, ID; Bowers, J. (diciembre de 1996). "Análisis de valor extremo en un entorno offshore multivariado". Investigación Oceánica Aplicada . 18 (6): 303–317. doi : 10.1016 / s0141-1187 (97) 00007-2 . ISSN 0141-1187 . 
  21. Beirlant, Jan; Goegebeur, Yuri; Teugels, Jozef; Segers, Johan (27 de agosto de 2004). Estadística de extremos: teoría y aplicaciones . Serie de Wiley en Probabilidad y Estadística. Chichester, Reino Unido: John Wiley & Sons, Ltd. doi : 10.1002 / 0470012382 . ISBN 9780470012383.
  22. ^ Coles, Stuart (2001). Introducción al modelado estadístico de valores extremos . Springer Series en Estadística. doi : 10.1007 / 978-1-4471-3675-0 . ISBN 978-1-84996-874-4. ISSN  0172-7397 .
  23. ^ Zachary, S .; Feld, G .; Ward, G .; Wolfram, J. (octubre de 1998). "Extrapolación multivariante en el entorno offshore". Investigación Oceánica Aplicada . 20 (5): 273–295. doi : 10.1016 / s0141-1187 (98) 00027-3 . ISSN 0141-1187 . 

Referencias

  • Abarbanel, H .; Koonin, S .; Levine, H .; MacDonald, G .; Rothaus, O. (enero de 1992), "Estadísticas de eventos extremos con aplicación al clima" (PDF) , JASON , JSR-90-30S , consultado el 3 de marzo de 2015
  • Alvarado, Ernesto; Sandberg, David V .; Pickford, Stewart G. (1998), "Modelado de grandes incendios forestales como eventos extremos" (PDF) , Northwest Science , 72 : 66–75, archivado desde el original (PDF) en 2009-02-26 , consultado 2009-02- 06
  • Balkema, A .; Laurens (1974), "Residual life time at great age", Annals of Probability , 2 (5): 792–804, doi : 10.1214 / aop / 1176996548 , JSTOR  2959306
  • Burry KV (1975). Métodos estadísticos en ciencias aplicadas . John Wiley e hijos.
  • Castillo E. (1988) Teoría del valor extremo en ingeniería. Academic Press, Inc. Nueva York. ISBN 0-12-163475-2 . 
  • Castillo, E., Hadi, AS, Balakrishnan, N. y Sarabia, JM (2005) Extreme Value and Related Models with Applications in Engineering and Science, Wiley Series in Probability and Statistics Wiley, Hoboken, New Jersey. ISBN 0-471-67172-X . 
  • Coles S. (2001) Introducción al modelado estadístico de valores extremos . Springer, Londres.
  • Embrechts P., Klüppelberg C. y Mikosch T. (1997) Modelado de eventos extremos para seguros y finanzas . Berlín: Spring Verlag
  • Fisher, RA; Tippett, LHC (1928), "Formas limitantes de la distribución de frecuencias del miembro más grande y más pequeño de una muestra", Proc. Camb. Phil. Soc. , 24 (2): 180-190, código Bib : 1928PCPS ... 24..180F , doi : 10.1017 / s0305004100015681
  • Gnedenko, BV (1943), "Sur la distribution limite du terme maximum d'une serie aleatoire", Annals of Mathematics , 44 (3): 423–453, doi : 10.2307 / 1968974 , JSTOR  1968974
  • Gumbel, EJ (1935), "Les valeurs extrêmes des statistiques distribuciones" (PDF) , Annales de l'Institut Henri Poincaré , 5 (2): 115-158 , recuperada 2009-04-01
  • Gumbel, EJ (2004) [1958], Statistics of Extremes , Mineola, NY: Dover, ISBN 978-0-486-43604-3
  • Makkonen, L. (2008), "Problemas en el análisis de valores extremos", Seguridad estructural , 30 (5): 405–419, doi : 10.1016 / j.strusafe.2006.12.001
  • Leadbetter, MR (1991), "Sobre la base del modelado de 'Picos por encima del umbral'", Estadísticas y letras de probabilidad , 12 (4): 357–362, doi : 10.1016 / 0167-7152 (91) 90107-3
  • Leadbetter MR, Lindgren G. y Rootzen H. (1982) Extremos y propiedades relacionadas de secuencias y procesos aleatorios. Springer-Verlag, Nueva York.
  • Lindgren, G .; Rootzen, H. (1987), "Valores extremos: teoría y aplicaciones técnicas", Scandinavian Journal of Statistics, Theory and Applications , 14 : 241–279
  • Novak SY (2011) Métodos de valor extremo con aplicaciones a las finanzas . Chapman & Hall / CRC Press, Londres. ISBN 978-1-4398-3574-6 
  • Pickands, J (1975), "Inferencia estadística utilizando estadísticas de orden extremo", Annals of Statistics , 3 : 119-131, doi : 10.1214 / aos / 1176343003

Software

  • Estadísticas de valor extremo en R : paquetes para estadísticas de valor extremo en R
  • ExtremeStats.jl y Extremes.jl - Estadísticas de valor extremo en Julia

enlaces externos

  • La teoría del valor extremo puede salvar su cuello Fácil introducción no matemática (pdf)
  • Código fuente para análisis de valores extremos estacionarios y no estacionarios Universidad de California, Irvine
  • Pasos para aplicar la teoría del valor extremo a las finanzas: una revisión
  • Les valeurs extrêmes des distributions statistiques Acceso al texto completo de las conferencias celebradas por EJ Gumbel en 1933-1934, en francés (pdf)
Obtenido de " https://en.wikipedia.org/w/index.php?title=Extreme_value_theory&oldid=1042658371 "