Serie de Edgeworth

La serie Gram – Charlier A (nombrada en honor a Jørgen Pedersen Gram y Carl Charlier ) y la serie Edgeworth (nombrada en honor a Francis Ysidro Edgeworth ) son series que se aproximan a una distribución de probabilidad en términos de sus acumulados . ^[1] Las series son iguales; pero la disposición de los términos (y por lo tanto la precisión de truncar la serie) difieren. ^[2] La idea clave de estas expansiones es escribir la función característica de la distribución cuya función de densidad de probabilidad $f$ debe aproximarse en términos de la función característica de una distribución con propiedades conocidas y adecuadas, y recuperar $f$ mediante la transformada inversa de Fourier .

Serie Gram – Charlier A

Examinamos una variable aleatoria continua. Dejar ${\ Displaystyle {\ hat {f}}}$ ser la función característica de su distribución cuya función de densidad es $f$ , y ${\ Displaystyle \ kappa _ {r}}$ sus acumulados . Nos expandimos en términos de una distribución conocida con función de densidad de probabilidad $ψ$ , función característica ${\ Displaystyle {\ hat {\ psi}}}$ y acumulativos ${\ Displaystyle \ gamma _ {r}}$ . La densidad $ψ$ generalmente se elige para que sea la de la distribución normal , pero también son posibles otras opciones. Según la definición de los acumulantes, tenemos (véase Wallace, 1958) ^[3]

{\ Displaystyle {\ hat {f}} (t) = \ exp \ left [\ sum _ {r = 1} ^ {\ infty} \ kappa _ {r} {\ frac {(it) ^ {r}} {r!}} \ right]}

y

{\ Displaystyle {\ hat {\ psi}} (t) = \ exp \ left [\ sum _ {r = 1} ^ {\ infty} \ gamma _ {r} {\ frac {(it) ^ {r} } {r!}} \ right],}

que le da la siguiente identidad formal:

{\ Displaystyle {\ hat {f}} (t) = \ exp \ left [\ sum _ {r = 1} ^ {\ infty} (\ kappa _ {r} - \ gamma _ {r}) {\ frac {(it) ^ {r}} {r!}} \ right] {\ hat {\ psi}} (t) \ ,.}

Por las propiedades de la transformada de Fourier, ${\ Displaystyle (it) ^ {r} {\ hat {\ psi}} (t)}$ es la transformada de Fourier de ${\ Displaystyle (-1) ^ {r} [D ^ {r} \ psi] (- x)}$ , donde $D$ es el operador diferencial con respecto $ax$ . Así, después de cambiar ${\ Displaystyle x}$ con ${\ Displaystyle -x}$ en ambos lados de la ecuación, encontramos para $f$ la expansión formal

{\ Displaystyle f (x) = \ exp \ left [\ sum _ {r = 1} ^ {\ infty} (\ kappa _ {r} - \ gamma _ {r}) {\ frac {(-D) ^ {r}} {r!}} \ right] \ psi (x) \ ,.}

Si se elige $ψ$ como densidad normal

{\ Displaystyle \ phi (x) = {\ frac {1} {{\ sqrt {2 \ pi}} \ sigma}} \ exp \ left [- {\ frac {(x- \ mu) ^ {2}} {2 \ sigma ^ {2}}} \ right]}

con media y varianza dadas por $f$ , es decir, media ${\ Displaystyle \ mu = \ kappa _ {1}}$ y varianza ${\ Displaystyle \ sigma ^ {2} = \ kappa _ {2}}$ , entonces la expansión se convierte en

{\ Displaystyle f (x) = \ exp \ left [\ sum _ {r = 3} ^ {\ infty} \ kappa _ {r} {\ frac {(-D) ^ {r}} {r!}} \ right] \ phi (x),}

desde ${\ Displaystyle \ gamma _ {r} = 0}$ para todo $r$ > 2, ya que los acumuladores superiores de la distribución normal son 0. Al expandir el exponencial y recopilar términos de acuerdo con el orden de las derivadas, llegamos a la serie A de Gram-Charlier. Tal expansión se puede escribir de forma compacta en términos de polinomios de Bell como

{\ Displaystyle \ exp \ left [\ sum _ {r = 3} ^ {\ infty} \ kappa _ {r} {\ frac {(-D) ^ {r}} {r!}} \ right] = \ suma _ {n = 0} ^ {\ infty} B_ {n} (0,0, \ kappa _ {3}, \ ldots, \ kappa _ {n}) {\ frac {(-D) ^ {n} }{¡norte!}}.}

Dado que la n-ésima derivada de la función gaussiana ${\ Displaystyle \ phi}$ se da en términos del polinomio de Hermite como

{\ Displaystyle \ phi ^ {(n)} (x) = {\ frac {(-1) ^ {n}} {\ sigma ^ {n}}} He_ {n} \ left ({\ frac {x- \ mu} {\ sigma}} \ derecha) \ phi (x),}

esto nos da la expresión final de la serie Gram-Charlier A como

{\ Displaystyle f (x) = \ phi (x) \ sum _ {n = 0} ^ {\ infty} {\ frac {1} {n! \ sigma ^ {n}}} B_ {n} (0, 0, \ kappa _ {3}, \ ldots, \ kappa _ {n}) He_ {n} \ left ({\ frac {x- \ mu} {\ sigma}} \ right).}

La integración de la serie nos da la función de distribución acumulativa

{\ Displaystyle F (x) = \ int _ {- \ infty} ^ {x} f (u) du = \ Phi (x) - \ phi (x) \ sum _ {n = 3} ^ {\ infty} {\ frac {1} {n! \ sigma ^ {n-1}}} B_ {n} (0,0, \ kappa _ {3}, \ ldots, \ kappa _ {n}) He_ {n-1 } \ left ({\ frac {x- \ mu} {\ sigma}} \ right),}

dónde ${\ Displaystyle \ Phi}$ es la CDF de la distribución normal.

Si incluimos solo los dos primeros términos de corrección a la distribución normal, obtenemos

{\ Displaystyle f (x) \ approx {\ frac {1} {{\ sqrt {2 \ pi}} \ sigma}} \ exp \ left [- {\ frac {(x- \ mu) ^ {2}} {2 \ sigma ^ {2}}} \ right] \ left [1 + {\ frac {\ kappa _ {3}} {3! \ Sigma ^ {3}}} He_ {3} \ left ({\ frac {x- \ mu} {\ sigma}} \ right) + {\ frac {\ kappa _ {4}} {4! \ sigma ^ {4}}} He_ {4} \ left ({\ frac {x- \ mu} {\ sigma}} \ right) \ right] \ ,,}

con ${\ Displaystyle He_ {3} (x) = x ^ {3} -3x}$ y ${\ Displaystyle He_ {4} (x) = x ^ {4} -6x ^ {2} +3}$ .

Tenga en cuenta que no se garantiza que esta expresión sea positiva y, por lo tanto, no es una distribución de probabilidad válida. La serie Gram-Charlier A diverge en muchos casos de interés; converge solo si ${\ Displaystyle f (x)}$ se cae más rápido que ${\ Displaystyle \ exp (- (x ^ {2}) / 4)}$ en el infinito (Cramér 1957). Cuando no converge, la serie tampoco es una verdadera expansión asintótica , porque no es posible estimar el error de la expansión. Por esta razón, la serie Edgeworth (consulte la siguiente sección) generalmente se prefiere a la serie Gram – Charlier A.

La serie Edgeworth

Edgeworth desarrolló una expansión similar como una mejora del teorema del límite central . ^[4] La ventaja de la serie Edgeworth es que el error está controlado, por lo que es una verdadera expansión asintótica .

Dejar ${\ Displaystyle \ {Z_ {i} \}}$ ser una secuencia de variables aleatorias independientes e idénticamente distribuidas con media ${\ Displaystyle \ mu}$ y varianza ${\ Displaystyle \ sigma ^ {2}}$ , y deja ${\ Displaystyle X_ {n}}$ sean sus sumas estandarizadas:

{\ Displaystyle X_ {n} = {\ frac {1} {\ sqrt {n}}} \ sum _ {i = 1} ^ {n} {\ frac {Z_ {i} - \ mu} {\ sigma} }.}

Dejar ${\ Displaystyle F_ {n}}$ denotar las funciones de distribución acumulativa de las variables ${\ Displaystyle X_ {n}}$ . Luego, por el teorema del límite central,

{\ Displaystyle \ lim _ {n \ to \ infty} F_ {n} (x) = \ Phi (x) \ equiv \ int _ {- \ infty} ^ {x} {\ tfrac {1} {\ sqrt { 2 \ pi}}} e ^ {- {\ frac {1} {2}} q ^ {2}} dq}

para cada ${\ Displaystyle x}$ , siempre que la media y la varianza sean finitas.

Ahora suponga que, además de tener ${\ Displaystyle \ mu}$ y varianza ${\ Displaystyle \ sigma ^ {2}}$ , las variables aleatorias iid ${\ Displaystyle Z_ {i}}$ tienen acumulaciones más altas ${\ Displaystyle \ kappa _ {r}}$ . A partir de las propiedades de aditividad y homogeneidad de los acumuladores, los acumulados de ${\ Displaystyle X_ {n}}$ en términos de los acumulados de ${\ Displaystyle Z_ {i}}$ son para ${\ Displaystyle r \ geq 2}$ ,

{\ Displaystyle \ kappa _ {r} ^ {F_ {n}} = {\ frac {n \ kappa _ {r}} {\ sigma ^ {r} n ^ {r / 2}}} = {\ frac { \ lambda _ {r}} {n ^ {r / 2-1}}} \ quad \ mathrm {donde} \ quad \ lambda _ {r} = {\ frac {\ kappa _ {r}} {\ sigma ^ {r}}}.}

Si expandimos en términos de la distribución normal estándar, es decir, si establecemos

{\ Displaystyle \ phi (x) = {\ frac {1} {\ sqrt {2 \ pi}}} \ exp (- {\ tfrac {1} {2}} x ^ {2}),}

luego las diferencias acumuladas en la expresión formal de la función característica ${\ Displaystyle {\ hat {f}} _ {n} (t)}$ de ${\ Displaystyle F_ {n}}$ están

{\ Displaystyle \ kappa _ {1} ^ {F_ {n}} - \ gamma _ {1} = 0,}

{\ Displaystyle \ kappa _ {2} ^ {F_ {n}} - \ gamma _ {2} = 0,}

{\ Displaystyle \ kappa _ {r} ^ {F_ {n}} - \ gamma _ {r} = {\ frac {\ lambda _ {r}} {n ^ {r / 2-1}}}; \ qquad r \ geq 3.}

La serie Gram-Charlier A para la función de densidad de ${\ Displaystyle X_ {n}}$ es ahora

{\ Displaystyle f_ {n} (x) = \ phi (x) \ sum _ {r = 0} ^ {\ infty} {\ frac {1} {r!}} B_ {r} \ left (0,0 , {\ frac {\ lambda _ {3}} {n ^ {1/2}}}, \ ldots, {\ frac {\ lambda _ {r}} {n ^ {r / 2-1}}} \ derecha) He_ {r} (x).}

La serie Edgeworth se desarrolla de manera similar a la serie Gram-Charlier A, solo que ahora los términos se recopilan de acuerdo con los poderes de ${\ Displaystyle n}$ . Los coeficientes del término n ^{-m / 2} se pueden obtener recolectando los monomios de los polinomios de Bell correspondientes a las particiones enteras de m . Por tanto, tenemos la función característica como

{\ Displaystyle {\ hat {f}} _ {n} (t) = \ left [1+ \ sum _ {j = 1} ^ {\ infty} {\ frac {P_ {j} (it)} {n ^ {j / 2}}} \ right] \ exp (-t ^ {2} / 2) \ ,,}

dónde ${\ Displaystyle P_ {j} (x)}$ es un polinomio de grado ${\ displaystyle 3j}$ . Nuevamente, después de la transformada de Fourier inversa, la función de densidad ${\ Displaystyle f_ {n}}$ sigue como

{\ Displaystyle f_ {n} (x) = \ phi (x) + \ sum _ {j = 1} ^ {\ infty} {\ frac {P_ {j} (- D)} {n ^ {j / 2 }}} \ phi (x) \ ,.}

Asimismo, integrando la serie, obtenemos la función de distribución

{\ Displaystyle F_ {n} (x) = \ Phi (x) + \ sum _ {j = 1} ^ {\ infty} {\ frac {1} {n ^ {j / 2}}} {\ frac { P_ {j} (- D)} {D}} \ phi (x) \ ,.}

Podemos escribir explícitamente el polinomio ${\ Displaystyle P_ {m} (- D)}$ como

{\ Displaystyle P_ {m} (- D) = \ sum \ prod _ {i} {\ frac {1} {k_ {i}!}} \ left ({\ frac {\ lambda _ {l_ {i}} } {l_ {i}!}} \ right) ^ {k_ {i}} (- D) ^ {s},}

donde la suma es sobre todas las particiones enteras de m tal que ${\ Displaystyle \ sum _ {i} ik_ {i} = m}$ y ${\ Displaystyle l_ {i} = i + 2}$ y ${\ Displaystyle s = \ sum _ {i} k_ {i} l_ {i}.}$

Por ejemplo, si m = 3, entonces hay tres formas de dividir este número: 1 + 1 + 1 = 2 + 1 = 3. Como tal, necesitamos examinar tres casos:

1 + 1 + 1 = 1 · k ₁ , entonces tenemos k ₁ = 3, l ₁ = 3 y s = 9.
1 + 2 = 1 · k ₁ + 2 · k ₂ , entonces tenemos k ₁ = 1, k ₂ = 1, l ₁ = 3, l ₂ = 4 y s = 7.
3 = 3 · k ₃ , entonces tenemos k ₃ = 1, l ₃ = 5 y s = 5.

Por lo tanto, el polinomio requerido es

{\ Displaystyle {\ begin {alineado} P_ {3} (- D) & = {\ frac {1} {3!}} \ left ({\ frac {\ lambda _ {3}} {3!}} \ derecha) ^ {3} (- D) ^ {9} + {\ frac {1} {1! 1!}} \ left ({\ frac {\ lambda _ {3}} {3!}} \ right) \ left ({\ frac {\ lambda _ {4}} {4!}} \ right) (- D) ^ {7} + {\ frac {1} {1!}} \ left ({\ frac {\ lambda _ {5}} {5!}} \ derecha) (- D) ^ {5} \\ & = {\ frac {\ lambda _ {3} ^ {3}} {1296}} (- D) ^ {9} + {\ frac {\ lambda _ {3} \ lambda _ {4}} {144}} (- D) ^ {7} + {\ frac {\ lambda _ {5}} {120}} ( -D) ^ {5}. \ End {alineado}}}

Los primeros cinco términos de la expansión son ^[5]

{\ Displaystyle {\ begin {alineado} f_ {n} (x) & = \ phi (x) \\ & \ quad - {\ frac {1} {n ^ {\ frac {1} {2}}}} \ left ({\ tfrac {1} {6}} \ lambda _ {3} \, \ phi ^ {(3)} (x) \ right) \\ & \ quad + {\ frac {1} {n} } \ left ({\ tfrac {1} {24}} \ lambda _ {4} \, \ phi ^ {(4)} (x) + {\ tfrac {1} {72}} \ lambda _ {3} ^ {2} \, \ phi ^ {(6)} (x) \ right) \\ & \ quad - {\ frac {1} {n ^ {\ frac {3} {2}}}} \ left ( {\ tfrac {1} {120}} \ lambda _ {5} \, \ phi ^ {(5)} (x) + {\ tfrac {1} {144}} \ lambda _ {3} \ lambda _ { 4} \, \ phi ^ {(7)} (x) + {\ tfrac {1} {1296}} \ lambda _ {3} ^ {3} \, \ phi ^ {(9)} (x) \ derecha) \\ & \ quad + {\ frac {1} {n ^ {2}}} \ left ({\ tfrac {1} {720}} \ lambda _ {6} \, \ phi ^ {(6) } (x) + \ left ({\ tfrac {1} {1152}} \ lambda _ {4} ^ {2} + {\ tfrac {1} {720}} \ lambda _ {3} \ lambda _ {5 } \ right) \ phi ^ {(8)} (x) + {\ tfrac {1} {1728}} \ lambda _ {3} ^ {2} \ lambda _ {4} \, \ phi ^ {(10 )} (x) + {\ tfrac {1} {31104}} \ lambda _ {3} ^ {4} \, \ phi ^ {(12)} (x) \ right) \\ & \ quad + O \ izquierda (n ^ {- {\ frac {5} {2}}} \ derecha). \ end {alineado}}}

Aquí, $φ (j) (x)$ es la j -ésima derivada de $φ (\cdot)$ en el punto x . Recordando que las derivadas de la densidad de la distribución normal están relacionadas con la densidad normal por ${\ Displaystyle \ phi ^ {(n)} (x) = (- 1) ^ {n} He_ {n} (x) \ phi (x)}$ , (dónde ${\ Displaystyle He_ {n}}$ es el polinomio de Hermite de orden n ), esto explica las representaciones alternativas en términos de la función de densidad. Blinnikov y Moessner (1998) han proporcionado un algoritmo simple para calcular términos de orden superior de la expansión.

Tenga en cuenta que en el caso de distribuciones de celosía (que tienen valores discretos), la expansión de Edgeworth debe ajustarse para tener en cuenta los saltos discontinuos entre puntos de celosía. ^[6]

Ilustración: densidad de la media muestral de tres ${\ Displaystyle \ chi ^ {2}}$

Densidad de la media muestral de tres variables chi2. El gráfico compara la densidad real, la aproximación normal y dos expansiones de Edgeworth.

Llevar ${\ Displaystyle X_ {i} \ sim \ chi ^ {2} (k = 2), \, i = 1,2,3 \, (n = 3)}$ y la media muestral ${\ Displaystyle {\ bar {X}} = {\ frac {1} {3}} \ sum _ {i = 1} ^ {3} X_ {i}}$ .

Podemos utilizar varias distribuciones para ${\ displaystyle {\ bar {X}}}$ :

La distribución exacta, que sigue una distribución gamma : ${\ Displaystyle {\ bar {X}} \ sim \ mathrm {Gamma} \ left (\ alpha = n \ cdot k / 2, \ theta = 2 / n \ right) = \ mathrm {Gamma} \ left (\ alpha = 3, \ theta = 2/3 \ right)}$ .
La distribución normal asintótica: ${\ Displaystyle {\ bar {X}} {\ xrightarrow {n \ to \ infty}} N (k, 2 \ cdot k / n) = N (2,4 / 3)}$ .
Dos expansiones de Edgeworth, de grados 2 y 3.

Discusión de resultados

Para muestras finitas, no se garantiza que una expansión de Edgeworth sea una distribución de probabilidad adecuada, ya que los valores de CDF en algunos puntos pueden ir más allá ${\ Displaystyle [0,1]}$ .
Garantizan (asintóticamente) errores absolutos , pero los errores relativos se pueden evaluar fácilmente comparando el término principal de Edgeworth en el resto con el término principal general. ^[7]

Ver también

Referencias

^ Stuart, A. y Kendall, MG (1968). La teoría avanzada de la estadística. Compañía editorial de Hafner.
^ Kolassa, JE (2006). Métodos de aproximación de series en estadística (Vol. 88). Springer Science & Business Media.
^ Wallace, DL (1958). "Aproximaciones asintóticas a distribuciones" . Anales de estadística matemática . 29 (3): 635–654. doi : 10.1214 / aoms / 1177706528 . JSTOR 2237255 .
↑ Hall, P. (2013). El bootstrap y la expansión de Edgeworth. Springer Science & Business Media.
^ Weisstein, Eric W. "Serie Edgeworth" . MathWorld .
^ Kolassa, John E .; McCullagh, Peter (1990). "Serie Edgeworth para distribuciones de celosía" . Annals of Statistics . 18 (2): 981–985. doi : 10.1214 / aos / 1176347637 . JSTOR 2242145 .
^ Kolassa, John E. (2006). Métodos de aproximación de series en estadística (3ª ed.). Saltador. ISBN 0387322272.

Otras lecturas

H. Cramér . (1957). Métodos matemáticos de estadística . Prensa de la Universidad de Princeton, Princeton.
Wallace, DL (1958). "Aproximaciones asintóticas a distribuciones" . Anales de estadística matemática . 29 (3): 635–654. doi : 10.1214 / aoms / 1177706528 .
M. Kendall y A. Stuart. (1977), La teoría avanzada de la estadística , Vol. 1: Teoría de la distribución, 4ª edición, Macmillan, Nueva York.
P. McCullagh (1987). Métodos tensoriales en estadística . Chapman y Hall, Londres.
DR Cox y OE Barndorff-Nielsen (1989). Técnicas asintóticas para uso en estadística . Chapman y Hall, Londres.
P. Hall (1992). La expansión Bootstrap y Edgeworth . Springer, Nueva York.
"Serie Edgeworth" , Enciclopedia de Matemáticas , EMS Press , 2001 [1994]
Blinnikov, S .; Moessner, R. (1998). "Expansiones para distribuciones casi gaussianas" (PDF) . Serie de suplementos de astronomía y astrofísica . 130 : 193-205. arXiv : astro-ph / 9711239 . Código Bibliográfico : 1998A y AS..130..193B . doi : 10.1051 / aas: 1998221 .
Martin, Douglas; Arora, Rohit (2017). "Ineficiencia y sesgo de valor en riesgo modificado y déficit esperado". Revista de riesgo . 19 (6): 59–84. doi : 10.21314 / JOR.2017.365 .
JE Kolassa (2006). Métodos de aproximación de series en estadística (3ª ed.). (Notas de la conferencia en Estadística # 88). Springer, Nueva York.

[1] Stuart, A. y Kendall, MG (1968). La teoría avanzada de la estadística. Compañía editorial de Hafner.

[2] Kolassa, JE (2006). Métodos de aproximación de series en estadística (Vol. 88). Springer Science & Business Media.

[3] Wallace, DL (1958). "Aproximaciones asintóticas a distribuciones" . Anales de estadística matemática . 29 (3): 635–654. doi : 10.1214 / aoms / 1177706528 . JSTOR 2237255 .

[4] Hall, P. (2013). El bootstrap y la expansión de Edgeworth. Springer Science & Business Media.

[5] Weisstein, Eric W. "Serie Edgeworth" . MathWorld .

[6] Kolassa, John E .; McCullagh, Peter (1990). "Serie Edgeworth para distribuciones de celosía" . Annals of Statistics . 18 (2): 981–985. doi : 10.1214 / aos / 1176347637 . JSTOR 2242145 .

[7] Kolassa, John E. (2006). Métodos de aproximación de series en estadística (3ª ed.). Saltador. ISBN 0387322272.

[1]