En probabilidad y estadística , la distribución log-logística (conocida como distribución de Fisk en economía ) es una distribución de probabilidad continua para una variable aleatoria no negativa . Se utiliza en el análisis de supervivencia como modelo paramétrico para eventos cuya tasa aumenta inicialmente y disminuye más tarde, como, por ejemplo, la tasa de mortalidad por cáncer después del diagnóstico o tratamiento. También se ha utilizado en hidrología para modelar el flujo de la corriente y la precipitación , en economía como un modelo simple de ladistribución de riqueza o ingresos , y en networking para modelar los tiempos de transmisión de datos considerando tanto la red como el software.
Función de densidad de probabilidad valores de como se muestra en la leyenda | |||
Función de distribución acumulativa valores de como se muestra en la leyenda | |||
Parámetros | escala forma | ||
---|---|---|---|
Apoyo | |||
CDF | |||
Significar | Si , más indefinido | ||
Mediana | |||
Modo | Si , 0 de lo contrario | ||
Diferencia | Ver texto principal | ||
MGF | [1] dónde es la función Beta . [2] | ||
CF | [1] dónde es la función Beta . [2] |
La distribución log-logística es la distribución de probabilidad de una variable aleatoria cuyo logaritmo tiene una distribución logística . Tiene una forma similar a la distribución logarítmica normal, pero tiene colas más pesadas . A diferencia del logaritmo normal, su función de distribución acumulativa se puede escribir en forma cerrada .
Caracterización
Hay varias parametrizaciones diferentes de la distribución en uso. El que se muestra aquí proporciona parámetros razonablemente interpretables y una forma simple para la función de distribución acumulativa . [3] [4] El parámetroes un parámetro de escala y también es la mediana de la distribución. El parámetroes un parámetro de forma . La distribución es unimodal cuandoy su dispersión disminuye a medida que aumenta.
La función de distribución acumulativa es
dónde , ,
La función de densidad de probabilidad es
Parametrización alternativa
Una parametrización alternativa viene dada por el par en analogía con la distribución logística:
Propiedades
Momentos
La El momento crudo existe solo cuandocuando viene dado por [5] [6]
donde B es la función beta . A partir de esto se pueden derivar expresiones para la media , la varianza , la asimetría y la curtosis . Escritura por conveniencia, la media es
y la varianza es
Las expresiones explícitas para la asimetría y la curtosis son largas. [7] Como tiende al infinito la media tiende a , la varianza y la asimetría tienden a cero y el exceso de curtosis tiende a 6/5 (ver también las distribuciones relacionadas a continuación).
Cuantiles
La función de cuantiles (función de distribución acumulativa inversa) es:
De ello se deduce que la mediana es, el cuartil inferior es y el cuartil superior es .
Aplicaciones
Análisis de supervivencia
La distribución log-logística proporciona un modelo paramétrico para el análisis de supervivencia . A diferencia de la distribución de Weibull más comúnmente utilizada , puede tener una función de riesgo no monótona : cuandola función de peligro es unimodal (cuando ≤ 1, el peligro disminuye monótonamente). El hecho de que la función de distribución acumulativa se pueda escribir en forma cerrada es particularmente útil para el análisis de datos de supervivencia con censura . [8] La distribución log-logística se puede utilizar como base de un modelo de tiempo de falla acelerado al permitir para diferenciar entre grupos, o más en general mediante la introducción de covariables que afectan pero no modelando como una función lineal de las covariables. [9]
La función de supervivencia es
y entonces la función de peligro es
La distribución log-logística con parámetro de forma es la distribución marginal de los tiempos intermedios en un proceso de conteo con distribución geométrica . [10]
Hidrología
La distribución log-logística se ha utilizado en hidrología para modelar los caudales de las corrientes y la precipitación. [3] [4]
Los valores extremos, como la precipitación máxima en un día y la descarga del río por mes o por año, a menudo siguen una distribución logarítmica normal . [11] Sin embargo, la distribución logarítmica normal necesita una aproximación numérica. Como la distribución log-logística, que se puede resolver analíticamente, es similar a la distribución log-normal, se puede utilizar en su lugar.
La imagen azul ilustra un ejemplo de ajuste de la distribución log-logística a las precipitaciones máximas de un día de octubre clasificadas y muestra el cinturón de confianza del 90% basado en la distribución binomial . Los datos de lluvia están representados por la posición de trazado r / ( n +1) como parte del análisis de frecuencia acumulada .
Ciencias económicas
La log-logística se ha utilizado como un modelo simple de la distribución de la riqueza o el ingreso en economía , donde se conoce como distribución de Fisk. [12] Su coeficiente de Gini es. [13]
Derivación del coeficiente de Gini |
---|
El coeficiente de Gini para una distribución de probabilidad continua toma la forma: dónde es el CDF de la distribución y es el valor esperado. Para la distribución log-logística, la fórmula para el coeficiente de Gini se convierte en: Definiendo la sustitución conduce a la ecuación más simple: Y haciendo la sustitucion simplifica aún más la fórmula del coeficiente de Gini para: El componente integral es equivalente a la función beta estándar . La función beta también se puede escribir como: dónde es la función gamma . Usando las propiedades de la función gamma, se puede demostrar que: De la fórmula de reflexión de Euler , la expresión se puede simplificar aún más: Finalmente, podemos concluir que el coeficiente de Gini para la distribución log-logística . |
Redes
El log-logistic se ha utilizado como modelo para el período de tiempo que comienza cuando algunos datos salen de una aplicación de usuario de software en una computadora y la respuesta es recibida por la misma aplicación después de viajar y ser procesada por otras computadoras, aplicaciones y redes. segmentos, la mayoría o todos sin garantías estrictas en tiempo real (por ejemplo, cuando una aplicación muestra datos provenientes de un sensor remoto conectado a Internet). Se ha demostrado que es un modelo probabilístico más preciso para eso que la distribución logarítmica normal u otras, siempre que se detecten adecuadamente cambios abruptos de régimen en las secuencias de esos tiempos. [14]
Distribuciones relacionadas
- Si luego
- ( Distribución de Dagum ).
- ( Distribución Singh-Maddala ).
- ( Distribución Beta Prime ).
- Si X tiene una distribución log-logística con parámetro de escala y parámetro de forma entonces Y = log ( X ) tiene una distribución logística con parámetro de ubicación y parámetro de escala
- Como parámetro de forma de la distribución log-logística aumenta, su forma se asemeja cada vez más a la de una distribución logística (muy estrecha) . Informalmente:
- La distribución log-logística con parámetro de forma y parámetro de escala es la misma que la distribución de Pareto generalizada con parámetro de ubicación, parámetro de forma y parámetro de escala
- La adición de otro parámetro (un parámetro de desplazamiento) da como resultado formalmente una distribución log-logística desplazada , pero esto generalmente se considera en una parametrización diferente para que la distribución pueda limitarse por encima o por debajo.
Generalizaciones
Varias distribuciones diferentes a veces se denominan distribución log-logística generalizada , ya que contienen la log-logística como un caso especial. [13] Estos incluyen la distribución Burr Tipo XII (también conocida como distribución Singh-Maddala ) y la distribución Dagum , las cuales incluyen un segundo parámetro de forma. Ambos son, a su vez, casos especiales de la distribución beta aún más generalizada del segundo tipo . Otra generalización más sencilla de la log-logística es la distribución log-logística desplazada .
Otra distribución log-logística generalizada es la transformada logarítmica de la distribución metalog , en la que las expansiones de las series de potencias en términos dese sustituyen por parámetros de distribución logística y . La distribución log-metalog resultante tiene una forma muy flexible, tiene PDF de forma cerrada simple y función de cuantiles , se puede ajustar a datos con mínimos cuadrados lineales y subsume que la distribución log-logística es un caso especial.
Ver también
- Distribuciones de probabilidad: lista de distribuciones importantes admitidas en intervalos semiinfinitos
Referencias
- ^ a b http://www.math.wm.edu/~leemis/chart/UDR/PDFs/Loglogistic.pdf
- ↑ a b Ekawati, D .; Warsono; Kurniasari, D. (2014). "Sobre los momentos, acumulativos y función característica de la distribución log-logística". IPTEK, la revista de tecnología y ciencia . 25 (3): 78–82.
- ^ a b Shoukri, MM; Mian, IUM; Tracy, DS (1988), "Propiedades de muestreo de los estimadores de la distribución log-logística con aplicación a los datos de precipitación canadienses", The Canadian Journal of Statistics , 16 (3): 223-236, doi : 10.2307 / 3314729 , JSTOR 3314729
- ^ a b Ashkar, Fahim; Mahdi, Smail (2006), "Ajuste de la distribución log-logística por momentos generalizados", Journal of Hydrology , 328 (3–4): 694–703, Bibcode : 2006JHyd..328..694A , doi : 10.1016 / j. jhydrol.2006.01.014
- ^ Tadikamalla, Pandu R .; Johnson, Norman L. (1982), "Sistemas de curvas de frecuencia generadas por transformaciones de variables logísticas", Biometrika , 69 (2): 461–465, CiteSeerX 10.1.1.153.9487 , doi : 10.1093 / biomet / 69.2.461 , JSTOR 2335422
- ^ Tadikamalla, Pandu R. (1980), "A Look at the Burr and Related Distributions", Revista Estadística Internacional , 48 (3): 337–344, doi : 10.2307 / 1402945 , JSTOR 1402945
- ^ McLaughlin, Michael P. (2001), Compendio de distribuciones de probabilidad comunes (PDF) , p. A-37 , consultado el 15 de febrero de 2008
- ^ Bennett, Steve (1983), "Modelos de regresión log-logística para datos de supervivencia", Revista de la Royal Statistical Society, Serie C , 32 (2): 165-171, doi : 10.2307 / 2347295 , JSTOR 2347295
- ^ Collett, Dave (2003), Modelado de datos de supervivencia en la investigación médica (2a ed.), CRC press, ISBN 978-1-58488-325-8
- ^ Di Crescenzo, Antonio; Pellerey, Franco (2019), "Algunos resultados y aplicaciones de los procesos de conteo geométrico", Metodología y Computación en Probabilidad Aplicada , 21 (1): 203–233, doi : 10.1007 / s11009-018-9649-9
- ^ Ritzema (ed.), HP (1994), Análisis de frecuencia y regresión , Capítulo 6 en: Principios y aplicaciones de drenaje, Publicación 16, Instituto Internacional para la Reclamación y Mejoramiento de Tierras (ILRI), Wageningen, Países Bajos, págs. 175-224 , ISBN 978-90-70754-33-4CS1 maint: texto adicional: lista de autores ( enlace )
- ^ Fisk, PR (1961), "The Graduation of Income Distributions", Econometrica , 29 (2): 171–185, doi : 10.2307 / 1909287 , JSTOR 1909287
- ^ a b Kleiber, C .; Kotz, S (2003), Distribuciones de tamaño estadístico en economía y ciencias actuariales , Wiley, ISBN 978-0-471-15064-0
- ^ Gago-Benítez, A .; Fernández-Madrigal J.-A., Cruz-Martín, A. (2013), "Modelado log-logístico de retrasos de flujo sensorial en telerobots en red", IEEE Sensors Journal , IEEE Sensors 13 (8), 13 (8): 2944 –2953, código bibliográfico : 2013ISenJ..13.2944G , doi : 10.1109 / JSEN.2013.2263381CS1 maint: varios nombres: lista de autores ( enlace )