Formalizada por John Tukey , la distribución lambda de Tukey es una distribución de probabilidad simétrica continua definida en términos de su función de cuantiles . Por lo general, se usa para identificar una distribución adecuada (consulte los comentarios a continuación) y no se usa directamente en modelos estadísticos .
Función de densidad de probabilidad | |||
Notación | Tukey ( λ ) | ||
---|---|---|---|
Parámetros | λ ∈ R - parámetro de forma | ||
Apoyo | x ∈ [−1 / λ , 1 / λ ] para λ > 0, x ∈ R para λ ≤ 0 | ||
CDF | (caso especial) (caso general) | ||
Significar | |||
Mediana | 0 | ||
Modo | 0 | ||
Diferencia | | ||
Oblicuidad | |||
Ex. curtosis | | ||
Entropía | [1] | ||
CF | [2] |
La distribución de Tukey lambda tiene un único parámetro de forma , λ, y al igual que con otras distribuciones de probabilidad, se puede transformar con un parámetro de ubicación , μ, y un parámetro de escala , σ. Dado que la forma general de distribución de probabilidad se puede expresar en términos de la distribución estándar, las fórmulas siguientes se dan para la forma estándar de la función.
Función cuantil
Para la forma estándar de la distribución lambda de Tukey, la función cuantil, (es decir, la función inversa a la función de distribución acumulativa ) y la función de densidad de cuantiles ( están
Para la mayoría de los valores del parámetro de forma, λ , la función de densidad de probabilidad (PDF) y la función de distribución acumulativa (CDF) deben calcularse numéricamente. La distribución de Tukey lambda tiene una forma simple y cerrada para el CDF y / o PDF solo para algunos valores excepcionales del parámetro de forma, por ejemplo: λ ∈ {2, 1,1/2, 0} (ver distribución uniforme [caso λ = 1] y distribución logística [caso λ = 0]).
Sin embargo, para cualquier valor de λ, tanto la CDF como la PDF se pueden tabular para cualquier número de probabilidades acumuladas, p , utilizando la función de cuantil Q para calcular el valor x , para cada probabilidad acumulada p , con la densidad de probabilidad dada por 1/q, el recíproco de la función de densidad de cuantiles. Como es el caso habitual con las distribuciones estadísticas, la distribución lambda de Tukey se puede utilizar fácilmente buscando valores en una tabla preparada.
Momentos
La distribución de Tukey lambda es simétrica alrededor de cero, por lo tanto, el valor esperado de esta distribución es igual a cero. La varianza existe para λ > - 1/2y viene dado por la fórmula (excepto cuando λ = 0)
De manera más general, el momento de n -ésimo orden es finito cuando λ > −1/nortey se expresa en términos de la función beta Β ( x , y ) (excepto cuando λ = 0):
Tenga en cuenta que debido a la simetría de la función de densidad, todos los momentos de órdenes impares son iguales a cero.
Momentos L
A diferencia de los momentos centrales, los momentos L se pueden expresar en forma cerrada. El momento L de orden r> 1 viene dado por [3]
Los primeros seis momentos L se pueden presentar de la siguiente manera: [3]
Comentarios
La distribución de Tukey lambda es en realidad una familia de distribuciones que puede aproximarse a varias distribuciones comunes. Por ejemplo,
λ = −1 | aprox. Cauchy C (0, π ) |
λ = 0 | exactamente logístico |
λ = 0,14 | aprox. normal N (0, 2,142) |
λ = 0,5 | estrictamente cóncava (-conformado) |
λ = 1 | exactamente uniforme U (−1, 1) |
λ = 2 | exactamente uniforme U (- 1/2, 1/2) |
El uso más común de esta distribución es generar un diagrama PPCC de Tukey lambda de un conjunto de datos . Basado en la gráfica PPCC , se sugiere un modelo apropiado para los datos. Por ejemplo, si el mejor ajuste de la curva a los datos ocurre para un valor de λ en o cerca de 0.14, entonces los datos podrían estar bien modelados con una distribución normal. Los valores de λ inferiores a 0,14 sugieren una distribución de colas más pesadas; un hito en λ = 0 (logístico) indicaría colas bastante gruesas, con el límite extremo en λ = −1, aproximándose a Cauchy. Es decir, como el valor de mejor ajuste de λ varía de 0,14 a -1, se sugiere una PDF en forma de campana con colas cada vez más pesadas. De manera similar, para un valor óptimo de λ se vuelve mayor que 0.14 sugiere una distribución con colas excepcionalmente delgadas (basado en el punto de vista de que la distribución normal en sí es de cola delgada para empezar).
Excepto por valores de λ muy cercanos a 0, todas las funciones de PDF sugeridas tienen soporte finito , entre −1 /| λ | y +1 /| λ | .
Dado que la distribución de Tukey lambda es una distribución simétrica , el uso de la gráfica de Tukey lambda PPCC para determinar una distribución razonable para modelar los datos solo se aplica a distribuciones simétricas. Un histograma de los datos debe proporcionar evidencia de si los datos pueden modelarse razonablemente con una distribución simétrica. [4]
Referencias
- ^ Vasicek, Oldrich (1976), "Una prueba de normalidad basada en la entropía de la muestra", Revista de la Royal Statistical Society , Serie B , 38 (1): 54-59.
- ^ Shaw, WT; McCabe, J. (2009), "Muestreo de Monte Carlo dada una función característica: mecánica cuantílica en el espacio de momento", arXiv : 0903.1592
- ^ a b Karvanen, Juha; Nuutinen, Arto (2008). "Caracterización de la distribución lambda generalizada por momentos L". Estadística computacional y análisis de datos . 52 : 1971–1983. arXiv : matemáticas / 0701405 . doi : 10.1016 / j.csda.2007.06.021 .
- ^ Joiner, Brian L .; Rosenblatt, Joan R. (1971). "Algunas propiedades del rango en muestras de distribuciones lambda simétricas de Tukey". Revista de la Asociación Estadounidense de Estadística . 66 (334): 394–399. doi : 10.2307 / 2283943 . JSTOR 2283943 .
enlaces externos
- "1.3.6.6.15 - Distribución Tukey-Lambda" . Galería de Distribuciones. Manual de estadísticas de ingeniería. NIST de EE. UU. - Laboratorio de tecnología de la información. EDA 366F.
Este artículo incorpora material de dominio público del sitio web del Instituto Nacional de Estándares y Tecnología https://www.nist.gov .