La serie Gram – Charlier A (nombrada en honor a Jørgen Pedersen Gram y Carl Charlier ) y la serie Edgeworth (nombrada en honor a Francis Ysidro Edgeworth ) son series que se aproximan a una distribución de probabilidad en términos de sus acumulados . [1] Las series son iguales; pero la disposición de los términos (y por lo tanto la precisión de truncar la serie) difieren. [2] La idea clave de estas expansiones es escribir la función característica de la distribución cuya función de densidad de probabilidad fdebe aproximarse en términos de la función característica de una distribución con propiedades conocidas y adecuadas, y recuperar f mediante la transformada inversa de Fourier .
Serie Gram – Charlier A
Examinamos una variable aleatoria continua. Dejarser la función característica de su distribución cuya función de densidad es f , ysus acumulados . Nos expandimos en términos de una distribución conocida con función de densidad de probabilidad ψ , función característicay acumulativos . La densidad ψ generalmente se elige para que sea la de la distribución normal , pero también son posibles otras opciones. Según la definición de los acumulantes, tenemos (véase Wallace, 1958) [3]
- y
que le da la siguiente identidad formal:
Por las propiedades de la transformada de Fourier, es la transformada de Fourier de , donde D es el operador diferencial con respecto ax . Así, después de cambiar con en ambos lados de la ecuación, encontramos para f la expansión formal
Si se elige ψ como densidad normal
con media y varianza dadas por f , es decir, media y varianza , entonces la expansión se convierte en
desde para todo r > 2, ya que los acumuladores superiores de la distribución normal son 0. Al expandir el exponencial y recopilar términos de acuerdo con el orden de las derivadas, llegamos a la serie A de Gram-Charlier. Tal expansión se puede escribir de forma compacta en términos de polinomios de Bell como
Dado que la n-ésima derivada de la función gaussiana se da en términos del polinomio de Hermite como
esto nos da la expresión final de la serie Gram-Charlier A como
La integración de la serie nos da la función de distribución acumulativa
dónde es la CDF de la distribución normal.
Si incluimos solo los dos primeros términos de corrección a la distribución normal, obtenemos
con y .
Tenga en cuenta que no se garantiza que esta expresión sea positiva y, por lo tanto, no es una distribución de probabilidad válida. La serie Gram-Charlier A diverge en muchos casos de interés; converge solo si se cae más rápido que en el infinito (Cramér 1957). Cuando no converge, la serie tampoco es una verdadera expansión asintótica , porque no es posible estimar el error de la expansión. Por esta razón, la serie Edgeworth (consulte la siguiente sección) generalmente se prefiere a la serie Gram – Charlier A.
La serie Edgeworth
Edgeworth desarrolló una expansión similar como una mejora del teorema del límite central . [4] La ventaja de la serie Edgeworth es que el error está controlado, por lo que es una verdadera expansión asintótica .
Dejar ser una secuencia de variables aleatorias independientes e idénticamente distribuidas con media y varianza , y deja sean sus sumas estandarizadas:
Dejar denotar las funciones de distribución acumulativa de las variables. Luego, por el teorema del límite central,
para cada , siempre que la media y la varianza sean finitas.
Ahora suponga que, además de tener y varianza , las variables aleatorias iid tienen acumulaciones más altas . A partir de las propiedades de aditividad y homogeneidad de los acumuladores, los acumulados de en términos de los acumulados de son para ,
Si expandimos en términos de la distribución normal estándar, es decir, si establecemos
luego las diferencias acumuladas en la expresión formal de la función característica de están
La serie Gram-Charlier A para la función de densidad de es ahora
La serie Edgeworth se desarrolla de manera similar a la serie Gram-Charlier A, solo que ahora los términos se recopilan de acuerdo con los poderes de . Los coeficientes del término n -m / 2 se pueden obtener recolectando los monomios de los polinomios de Bell correspondientes a las particiones enteras de m . Por tanto, tenemos la función característica como
dónde es un polinomio de grado. Nuevamente, después de la transformada de Fourier inversa, la función de densidad sigue como
Asimismo, integrando la serie, obtenemos la función de distribución
Podemos escribir explícitamente el polinomio como
donde la suma es sobre todas las particiones enteras de m tal que y y
Por ejemplo, si m = 3, entonces hay tres formas de dividir este número: 1 + 1 + 1 = 2 + 1 = 3. Como tal, necesitamos examinar tres casos:
- 1 + 1 + 1 = 1 · k 1 , entonces tenemos k 1 = 3, l 1 = 3 y s = 9.
- 1 + 2 = 1 · k 1 + 2 · k 2 , entonces tenemos k 1 = 1, k 2 = 1, l 1 = 3, l 2 = 4 y s = 7.
- 3 = 3 · k 3 , entonces tenemos k 3 = 1, l 3 = 5 y s = 5.
Por lo tanto, el polinomio requerido es
Los primeros cinco términos de la expansión son [5]
Aquí, φ ( j ) ( x ) es la j -ésima derivada de φ (·) en el punto x . Recordando que las derivadas de la densidad de la distribución normal están relacionadas con la densidad normal por, (dónde es el polinomio de Hermite de orden n ), esto explica las representaciones alternativas en términos de la función de densidad. Blinnikov y Moessner (1998) han proporcionado un algoritmo simple para calcular términos de orden superior de la expansión.
Tenga en cuenta que en el caso de distribuciones de celosía (que tienen valores discretos), la expansión de Edgeworth debe ajustarse para tener en cuenta los saltos discontinuos entre puntos de celosía. [6]
Ilustración: densidad de la media muestral de tres
Llevar y la media muestral .
Podemos utilizar varias distribuciones para :
- La distribución exacta, que sigue una distribución gamma :.
- La distribución normal asintótica: .
- Dos expansiones de Edgeworth, de grados 2 y 3.
Discusión de resultados
- Para muestras finitas, no se garantiza que una expansión de Edgeworth sea una distribución de probabilidad adecuada, ya que los valores de CDF en algunos puntos pueden ir más allá.
- Garantizan (asintóticamente) errores absolutos , pero los errores relativos se pueden evaluar fácilmente comparando el término principal de Edgeworth en el resto con el término principal general. [7]
Ver también
Referencias
- ^ Stuart, A. y Kendall, MG (1968). La teoría avanzada de la estadística. Compañía editorial de Hafner.
- ^ Kolassa, JE (2006). Métodos de aproximación de series en estadística (Vol. 88). Springer Science & Business Media.
- ^ Wallace, DL (1958). "Aproximaciones asintóticas a distribuciones" . Anales de estadística matemática . 29 (3): 635–654. doi : 10.1214 / aoms / 1177706528 . JSTOR 2237255 .
- ↑ Hall, P. (2013). El bootstrap y la expansión de Edgeworth. Springer Science & Business Media.
- ^ Weisstein, Eric W. "Serie Edgeworth" . MathWorld .
- ^ Kolassa, John E .; McCullagh, Peter (1990). "Serie Edgeworth para distribuciones de celosía" . Annals of Statistics . 18 (2): 981–985. doi : 10.1214 / aos / 1176347637 . JSTOR 2242145 .
- ^ Kolassa, John E. (2006). Métodos de aproximación de series en estadística (3ª ed.). Saltador. ISBN 0387322272.
Otras lecturas
- H. Cramér . (1957). Métodos matemáticos de estadística . Prensa de la Universidad de Princeton, Princeton.
- Wallace, DL (1958). "Aproximaciones asintóticas a distribuciones" . Anales de estadística matemática . 29 (3): 635–654. doi : 10.1214 / aoms / 1177706528 .
- M. Kendall y A. Stuart. (1977), La teoría avanzada de la estadística , Vol. 1: Teoría de la distribución, 4ª edición, Macmillan, Nueva York.
- P. McCullagh (1987). Métodos tensoriales en estadística . Chapman y Hall, Londres.
- DR Cox y OE Barndorff-Nielsen (1989). Técnicas asintóticas para uso en estadística . Chapman y Hall, Londres.
- P. Hall (1992). La expansión Bootstrap y Edgeworth . Springer, Nueva York.
- "Serie Edgeworth" , Enciclopedia de Matemáticas , EMS Press , 2001 [1994]
- Blinnikov, S .; Moessner, R. (1998). "Expansiones para distribuciones casi gaussianas" (PDF) . Serie de suplementos de astronomía y astrofísica . 130 : 193-205. arXiv : astro-ph / 9711239 . Código Bibliográfico : 1998A y AS..130..193B . doi : 10.1051 / aas: 1998221 .
- Martin, Douglas; Arora, Rohit (2017). "Ineficiencia y sesgo de valor en riesgo modificado y déficit esperado". Revista de riesgo . 19 (6): 59–84. doi : 10.21314 / JOR.2017.365 .
- JE Kolassa (2006). Métodos de aproximación de series en estadística (3ª ed.). (Notas de la conferencia en Estadística # 88). Springer, Nueva York.