Teorema del límite central

En la teoría de la probabilidad , el teorema del límite central ( CLT ) establece que, en muchas situaciones, cuando se agregan variables aleatorias independientes , su suma debidamente normalizada tiende hacia una distribución normal (informalmente una curva de campana ) incluso si las variables originales en sí mismas no están distribuidas normalmente. . El teorema es un concepto clave en la teoría de la probabilidad porque implica que los métodos probabilísticos y estadísticos que funcionan para distribuciones normales pueden ser aplicables a muchos problemas que involucran otros tipos de distribuciones.

Si son muestras aleatorias extraídas de una población con media general y varianza finita , y si es la media de la muestra , la forma límite de la distribución,, es la distribución normal estándar. ^[1] ${\ textstyle X_ {1}, X_ {2}, ..., X_ {n}}$ ${\ textstyle n}$ ${\ textstyle \ mu}$ ${\ estilo de texto \ sigma ^ {2}}$ ${\ textstyle {\ bar {X}} _ {n}}$ ${\ textstyle Z = \ lim _ {n \ to \ infty} {\ sqrt {n}} {\ left ({\ frac {{\ bar {X}} _ {n} - \ mu} {\ sigma}} \derecho)}}$

Por ejemplo, suponga que se obtiene una muestra que contiene muchas observaciones , cada observación se genera aleatoriamente de una manera que no depende de los valores de las otras observaciones, y que se calcula la media aritmética de los valores observados. Si este procedimiento se realiza muchas veces, el teorema del límite central dice que la distribución de probabilidad del promedio se aproximará mucho a una distribución normal. Un ejemplo simple de esto es que si uno lanza una moneda muchas veces , la probabilidad de obtener un número dado de caras se acercará a una distribución normal, con la media igual a la mitad del número total de lanzamientos. En el límite de un número infinito de giros, será igual a una distribución normal.

El teorema del límite central tiene varias variantes. En su forma común, las variables aleatorias deben distribuirse de manera idéntica. En variantes, la convergencia de la media a la distribución normal también ocurre para distribuciones no idénticas o para observaciones no independientes, si cumplen con ciertas condiciones.

La primera versión de este teorema, según la cual la distribución normal puede usarse como una aproximación a la distribución binomial , es el teorema de De Moivre-Laplace .

Secuencias independientes [ editar ]

Una distribución "suavizada" por suma , que muestra la densidad de distribución original y tres sumas posteriores; ver Ilustración del teorema del límite central para más detalles.

Cualquiera que sea la forma de distribución de la población, la distribución muestral tiende a ser gaussiana y su dispersión viene dada por el teorema del límite central. ^[2]

CLT clásico [ editar ]

Sea una muestra aleatoria de tamaño , es decir, una secuencia de variables aleatorias independientes e idénticamente distribuidas (iid) extraídas de una distribución del valor esperado dada por y la varianza finita dada por Supongamos que estamos interesados en el promedio de la muestra ${\ textstyle \; \ {X_ {1}, \ ldots, X_ {n} \} \;}$ ${\ estilo de texto \; n \;}$ ${\ estilo de texto \; \ mu \;}$ ${\ estilo de texto \; \ sigma ^ {2} ~.}$

{\ Displaystyle {\ bar {X}} _ {n} \ equiv {\ frac {X_ {1} + \ cdots + X_ {n}} {n}}}

de estas variables aleatorias. Por la ley de los números grandes , los promedios muestrales convergen casi con seguridad (y por lo tanto también convergen en probabilidad ) al valor esperado como El teorema del límite central clásico describe el tamaño y la forma de distribución de las fluctuaciones estocásticas alrededor del número determinista durante esta convergencia. Más precisamente, se afirma que a medida que se hace más grande, la distribución de la diferencia entre el promedio de la muestra y su límite cuando se multiplica por el factor ( que es ) se aproxima a la distribución normal con media 0 y varianza Por lo suficientemente grande ${\ estilo de texto \; \ mu \;}$ ${\ textstyle \; n \ to \ infty ~.}$ ${\ estilo de texto \; \ mu \;}$ ${\ estilo de texto \; n \;}$ ${\ textstyle {\ bar {X}} _ {n}}$ ${\ estilo de texto \; \ mu ~,}$ ${\ estilo de texto \; {\ sqrt {n}} \;}$ ${\ estilo de texto \; {\ sqrt {n}} ({\ bar {X}} _ {n} - \ mu) \;}$ ${\ estilo de texto \; \ sigma ^ {2} ~.}$ $n$ , la distribución de está cerca de la distribución normal con media y varianza La utilidad del teorema es que la distribución de se aproxima a la normalidad independientemente de la forma de la distribución del individuo Formalmente, el teorema se puede enunciar de la siguiente manera: ${\ textstyle \; {\ bar {X}} _ {n} \;}$ ${\ estilo de texto \; \ mu \;}$ ${\ textstyle \; \ sigma ^ {2} / n ~.}$ ${\ estilo de texto \; {\ sqrt {n}} ({\ bar {X}} _ {n} - \ mu) \;}$ ${\ estilo de texto \; X_ {i} ~.}$

Lindeberg – Lévy CLT. Supongamos que es una secuencia de iid variables aleatorias con y Entonces, como tiende a infinito, las variables aleatorias convergen en la distribución a una normal de : ^[3] ${\ textstyle \; \ {X_ {1}, \ ldots, X_ {n} \} \;}$ ${\ estilo de texto \; {\ mathcal {E}} [X_ {i}] = \ mu \;}$ ${\ textstyle \; {\ mathcal {Var}} [X_ {i}] = \ sigma ^ {2} <\ infty ~.}$ ${\ estilo de texto \; n \;}$ ${\ estilo de texto \; {\ sqrt {n}} ({\ bar {X}} _ {n} - \ mu) \;}$ ${\ estilo de texto \; N (0, \ sigma ^ {2}) \;}$
${\ Displaystyle {\ sqrt {n}} \ left ({\ bar {X}} _ {n} - \ mu \ right) \ \ xrightarrow {d} \ N \ left (0, \ sigma ^ {2} \ derecha) ~.}$

En el caso de la convergencia en la distribución significa que las funciones de distribución acumuladas de convergen puntualmente a la CDF de la distribución: para cada número real ${\ estilo de texto \; \ sigma> 0 ~,}$ ${\ estilo de texto \; {\ sqrt {n}} ({\ bar {X}} _ {n} - \ mu) \;}$ ${\ estilo de texto \; N (0, \ sigma ^ {2}) \;}$ ${\ estilo de texto \; z ~,}$

{\ Displaystyle \ lim _ {n \ to \ infty} {\ mathcal {Pr}} \ left [{\ sqrt {n}} ({\ bar {X}} _ {n} - \ mu) \ leq z \ derecha] = \ lim _ {n \ to \ infty} {\ mathcal {Pr}} \ izquierda [{\ frac {{\ sqrt {n}} ({\ bar {X}} _ {n} - \ mu) } {\ sigma}} \ leq {\ frac {z} {\ sigma}} \ right] = \ Phi \ left ({\ frac {z} {\ sigma}} \ right) ~,}

donde se evalúa la CDF normal estándar en La convergencia es uniforme en el sentido de que ${\ estilo de texto \; \ Phi (z) \;}$ ${\ estilo de texto \; z ~.}$ ${\ estilo de texto \; z \;}$

{\ Displaystyle \ lim _ {n \ to \ infty} \; \ sup _ {z \ in \ mathbb {R}} \; \ left | {\ mathcal {Pr}} \ left [{\ sqrt {n}} ({\ bar {X}} _ {n} - \ mu) \ leq z \ right] - \ Phi \ left ({\ frac {z} {\ sigma}} \ right) \ right | = 0 ~,}

donde denota el extremo superior (o extremo superior ) del conjunto. ^[4] ${\ estilo de texto \; \ mathrm {sup} \;}$

Lyapunov CLT [ editar ]

El teorema lleva el nombre del matemático ruso Aleksandr Lyapunov . En esta variante del teorema del límite central, las variables aleatorias deben ser independientes, pero no necesariamente distribuidas de manera idéntica. El teorema también requiere que las variables aleatorias tengan momentos de algún orden y que la tasa de crecimiento de estos momentos esté limitada por la condición de Lyapunov que se indica a continuación. ${\ estilo de texto \; X_ {i} \;}$ ${\ estilo de texto \; \ izquierda | X_ {i} \ derecha | \;}$ ${\ textstyle (2+ \ delta)}$

Lyapunov CLT. ^[5] Suponga que es una secuencia de variables aleatorias independientes, cada una con un valor esperado finito y varianza Definir ${\ textstyle \; \ {X_ {1}, \ ldots, X_ {n} \} \;}$ ${\ estilo de texto \; \ mu _ {i} \;}$ ${\ estilo de texto \; \ sigma _ {i} ^ {2} ~.}$
${\ Displaystyle s_ {n} ^ {2} = \ sum _ {i = 1} ^ {n} \ sigma _ {i} ^ {2} ~.}$
Si por alguna condición de Lyapunov ${\ textstyle \; \ delta> 0 ~,}$
${\ Displaystyle \ lim _ {n \ to \ infty} \; {\ frac {1} {s_ {n} ^ {2+ \ delta}}} \, \ sum _ {i = 1} ^ {n} \ mathbb {E} \ left [\ left | X_ {i} - \ mu _ {i} \ right | ^ {2+ \ delta} \ right] = 0}$
se satisface, entonces una suma de converge en la distribución a una variable aleatoria normal estándar, como va al infinito: ${\ textstyle \; {\ frac {X_ {i} - \ mu _ {i}} {s_ {n}}} \;}$ ${\ estilo de texto \; n \;}$
${\ Displaystyle {\ frac {1} {s_ {n}}} \, \ sum _ {i = 1} ^ {n} \ left (X_ {i} - \ mu _ {i} \ right) \ \ xrightarrow {d} \ N (0,1) ~.}$

En la práctica, suele ser más fácil comprobar el estado de Lyapunov en busca de ${\ estilo de texto \; \ delta = 1 ~.}$

Si una secuencia de variables aleatorias satisface la condición de Lyapunov, también satisface la condición de Lindeberg. Sin embargo, la implicación inversa no se sostiene.

Lindeberg CLT [ editar ]

En el mismo escenario y con la misma notación anterior, la condición de Lyapunov se puede reemplazar por la siguiente más débil (de Lindeberg en 1920).

Supongamos que para cada ${\ estilo de texto \; \ epsilon> 0 \;}$

{\ Displaystyle \ lim _ {n \ to \ infty} {\ frac {1} {s_ {n} ^ {2}}} \ sum _ {i = 1} ^ {n} \ mathbb {E} \ left [ (X_ {i} - \ mu _ {i}) ^ {2} \ cdot \ mathbf {1} _ {\ {\, X_ {i} \;: \; \ left | X_ {i} - \ mu _ {i} \ right | \,> \, \ varepsilon s_ {n} \, \}} \ right] = 0}

donde está la función del indicador . Entonces la distribución de las sumas estandarizadas ${\ textstyle \ mathbf {1} _ {\ {\ ldots \}}}$

{\ Displaystyle {\ frac {1} {s_ {n}}} \ sum _ {i = 1} ^ {n} \ left (X_ {i} - \ mu _ {i} \ right)}

converge hacia la distribución normal estándar . ${\ estilo de texto N (0,1)}$

CLT multidimensional [ editar ]

Las pruebas que utilizan funciones características pueden extenderse a casos en los que cada individuo es un vector aleatorio en con vector medio y matriz de covarianza (entre los componentes del vector), y estos vectores aleatorios son independientes e idénticamente distribuidos. La suma de estos vectores se realiza por componentes. El teorema del límite central multidimensional establece que cuando se escala, las sumas convergen en una distribución normal multivariante . ^[6] ${\ estilo de texto \; \ mathbf {X} _ {i} \;}$ ${\ textstyle \; {\ mathbb {R}} ^ {k} ~,}$ ${\ estilo de texto \; \ mu = {\ mathcal {E}} [\ mathbf {X} _ {i}] \;}$ ${\ estilo de texto \; \ mathbf {\ Sigma} \;}$

Dejar

{\ Displaystyle \ mathbf {X} _ {i} = {\ begin {bmatrix} X_ {i (1)} \\\ vdots \\ X_ {i (k)} \ end {bmatrix}}}

sea el $k$ -vector. La negrita significa que es un vector aleatorio, no una variable aleatoria (univariante). Entonces la suma de los vectores aleatorios será ${\ textstyle \ mathbf {X} _ {i}}$

{\ displaystyle {\ begin {bmatrix} X_ {1 (1)} \\\ vdots \\ X_ {1 (k)} \ end {bmatrix}} + {\ begin {bmatrix} X_ {2 (1)} \ \\ vdots \\ X_ {2 (k)} \ end {bmatrix}} + \ cdots + {\ begin {bmatrix} X_ {n (1)} \\\ vdots \\ X_ {n (k)} \ end {bmatrix}} = {\ begin {bmatrix} \ sum _ {i = 1} ^ {n} \ left [X_ {i (1)} \ right] \\\ vdots \\\ sum _ {i = 1} ^ {n} \ left [X_ {i (k)} \ right] \ end {bmatrix}} = \ sum _ {i = 1} ^ {n} \ mathbf {X} _ {i}}

y el promedio es

{\ Displaystyle {\ frac {1} {n}} \ sum _ {i = 1} ^ {n} \ mathbf {X} _ {i} = {\ frac {1} {n}} {\ begin {bmatrix } \ sum _ {i = 1} ^ {n} X_ {i (1)} \\\ vdots \\\ sum _ {i = 1} ^ {n} X_ {i (k)} \ end {bmatrix} } = {\ begin {bmatrix} {\ bar {X}} _ {i (1)} \\\ vdots \\ {\ bar {X}} _ {i (k)} \ end {bmatrix}} = \ mathbf {{\ bar {X}} _ {n}}}

y por lo tanto

{\ Displaystyle {\ frac {1} {\ sqrt {n}}} \ sum _ {i = 1} ^ {n} \ left [\ mathbf {X} _ {i} - \ mathbb {E} \ left ( X_ {i} \ right) \ right] = {\ frac {1} {\ sqrt {n}}} \ sum _ {i = 1} ^ {n} (\ mathbf {X} _ {i} - {\ símbolo en negrita {\ mu}}) = {\ sqrt {n}} \ left ({\ overline {\ mathbf {X}}} _ {n} - {\ boldsymbol {\ mu}} \ right) ~.}

El teorema del límite central multivariado establece que

{\ Displaystyle {\ sqrt {n}} \ left ({\ overline {\ mathbf {X}}} _ {n} - {\ boldsymbol {\ mu}} \ right) \, {\ stackrel {D} {\ flecha derecha}} \ N_ {k} (0, {\ boldsymbol {\ Sigma}})}

donde la matriz de covarianza es igual a ${\ Displaystyle {\ boldsymbol {\ Sigma}}}$

{\ displaystyle {\ boldsymbol {\ Sigma}} = {\ begin {bmatrix} {{\ mathcal {Var}} \ left (X_ {1 (1)} \ right)} & {\ mathcal {Cov}} \ left (X_ {1 (1)}, X_ {1 (2)} \ right) & {\ mathcal {Cov}} \ left (X_ {1 (1)}, X_ {1 (3)} \ right) & \ cdots & {\ mathcal {Cov}} \ left (X_ {1 (1)}, X_ {1 (k)} \ right) \\ {\ mathcal {Cov}} \ left (X_ {1 (2)}, X_ {1 (1)} \ right) & {\ mathcal {Var}} \ left (X_ {1 (2)} \ right) & {\ mathcal {Cov}} \ left (X_ {1 (2)}, X_ {1 (3)} \ right) & \ cdots & {\ mathcal {Cov}} \ left (X_ {1 (2)}, X_ {1 (k)} \ right) \\ {\ mathcal {Cov} } \ left (X_ {1 (3)}, X_ {1 (1)} \ right) & {\ mathcal {Cov}} \ left (X_ {1 (3)}, X_ {1 (2)} \ right ) & {\ mathcal {Var}} \ left (X_ {1 (3)} \ right) & \ cdots & {\ mathcal {Cov}} \ left (X_ {1 (3)}, X_ {1 (k) } \ right) \\\ vdots & \ vdots & \ vdots & \ ddots & \ vdots \\ {\ mathcal {Cov}} \ left (X_ {1 (k)}, X_ {1 (1)} \ right) & {\ mathcal {Cov}} \ left (X_ {1 (k)}, X_ {1 (2)} \ right) & {\ mathcal {Cov}} \ left (X_ {1 (k)},X_ {1 (3)} \ right) & \ cdots & {\ mathcal {Var}} \ left (X_ {1 (k)} \ right) \\\ end {bmatrix}} ~.}

La tasa de convergencia viene dada por el siguiente resultado tipo Berry-Esseen :

Teorema. ^[7] Sean vectores aleatorios de valor independiente , cada uno de los cuales tiene una media de cero. Escribir y asumir que es invertible. Sea un gaussiano -dimensional con la misma media y la misma matriz de covarianza que . Luego, para todos los conjuntos convexos , ${\ Displaystyle X_ {1}, \ dots, X_ {n}}$ ${\mathbb {R} }^{d}$ $S=\sum _{i=1}^{n}X_{i}$ $\Sigma ={\mathcal {Cov}}[S]$ $Z\sim N(0,\Sigma )$ $d$ $S$ $U\subseteq {\mathbb {R} }^{d}$
$\left|{\mathcal {Pr}}[S\in U]-{\mathcal {Pr}}[Z\in U]\right|\leq C\,d^{1/4}\gamma ~,$
donde es una constante universal, y denota la norma euclidiana sobre $\;C\;$ $\;\gamma =\sum _{i=1}^{n}{\mathcal {E}}\left[\|\Sigma ^{-1/2}X_{i}\|_{2}^{3}\right]~,$ $\;\|\cdot \|_{2}\;$ ${\mathbb {R} }^{d}~.$

Se desconoce si el factor es necesario. ^[8] ${\textstyle \;d^{1/4}\;}$

Teorema generalizado [ editar ]

El teorema del límite central establece que la suma de un número de variables aleatorias independientes e idénticamente distribuidas con varianzas finitas tenderá a una distribución normal a medida que aumenta el número de variables. Una generalización debida a Gnedenko y Kolmogorov establece que la suma de un número de variables aleatorias con distribuciones de cola de ley de potencia ( cola Paretiana ) que disminuyen a medida que dónde (y por lo tanto tienen varianza infinita) tenderá a una distribución estable a medida que aumenta el número de sumandos. . ^[9]^[10] Si entonces la suma converge a una distribución estable con un parámetro de estabilidad igual a 2, es decir, una distribución gaussiana. ${\textstyle \;{\vert x\vert }^{-\alpha -1}\;}$ ${\textstyle \;0<\alpha <2\;}$ ${\textstyle \;f(x;\alpha ,0,c,0)\;}$ ${\textstyle \;\alpha >2\;}$ ^[11]

Procesos dependientes [ editar ]

CLT bajo dependencia débil [ editar ]

Una generalización útil de una secuencia de variables aleatorias independientes distribuidas de manera idéntica es un proceso aleatorio de mezcla en tiempo discreto; "mezclar" significa, a grandes rasgos, que las variables aleatorias temporalmente alejadas entre sí son casi independientes. En la teoría ergódica y la teoría de la probabilidad se utilizan varios tipos de mezcla. Ver mezcla especialmente fuerte (también llamada mezcla α) definida por donde se denomina coeficiente de mezcla fuerte . ${\textstyle \alpha (n)\to 0}$ ${\textstyle \alpha (n)}$

Una formulación simplificada del teorema del límite central bajo una mezcla fuerte es: ^[12]

Teorema. Supongamos que es estacionario y se mezcla con y que y . Denota , luego el límite ${\textstyle \{X_{1},\ldots ,X_{n}\}}$ $\alpha$ ${\textstyle \alpha _{n}=O(n^{-5})}$ ${\textstyle \operatorname {E} [X_{n}]=0}$ ${\textstyle \operatorname {E} [{X_{n}}^{12}]<\infty }$ ${\textstyle S_{n}=X_{1}+\cdots +X_{n}}$
$\sigma ^{2}=\lim _{n}{\frac {\operatorname {E} \left(S_{n}^{2}\right)}{n}}$
existe, y si luego converge en distribución a . ${\textstyle \sigma \neq 0}$ ${\textstyle {\frac {S_{n}}{\sigma {\sqrt {n}}}}}$ ${\textstyle N(0,1)}$

De hecho,

\sigma ^{2}=\operatorname {E} \left(X_{1}^{2}\right)+2\sum _{k=1}^{\infty }\operatorname {E} \left(X_{1}X_{1+k}\right),

donde la serie converge absolutamente.

No se puede omitir el supuesto , ya que la normalidad asintótica falla para donde hay otra secuencia estacionaria . ${\textstyle \sigma \neq 0}$ ${\textstyle X_{n}=Y_{n}-Y_{n-1}}$ ${\textstyle Y_{n}}$

Hay una versión más fuerte del teorema: ^[13] la suposición se reemplaza por , y la suposición se reemplaza con ${\textstyle \operatorname {E} [{X_{n}}^{12}]<\infty }$ ${\textstyle \operatorname {E} [{\vert X_{n}\vert }^{2+\delta }]<\infty }$ ${\textstyle \alpha _{n}=O(n^{-5})}$

\sum _{n}\alpha _{n}^{\frac {\delta }{2(2+\delta )}}<\infty .

La existencia de tales asegura la conclusión. Para el tratamiento enciclopédico de los teoremas límite en condiciones de mezcla, ver ( Bradley 2007 ). ${\textstyle \delta >0}$

Diferencia de martingala CLT [ editar ]

Teorema . Deja que una martingala satisfaga ${\textstyle M_{n}}$
${\frac {1}{n}}\sum _{k=1}^{n}\operatorname {E} \left(\left(M_{k}-M_{k-1}\right)^{2}|M_{1},\dots ,M_{k-1}\right)\to 1$ en probabilidad como $n \to \infty$ ,
para todo $ε > 0$ , cuando $n$ $\to \infty$ , ${\frac {1}{n}}\sum _{k=1}^{n}\operatorname {E} \left(\left(M_{k}-M_{k-1}\right)^{2};|M_{k}-M_{k-1}|>\varepsilon {\sqrt {n}}\right)\to 0$
luego converge en distribución a como . ^[14]^[15] ${\textstyle {\frac {M_{n}}{\sqrt {n}}}}$ ${\textstyle N(0,1)}$ ${\textstyle n\to \infty }$

Precaución: La expectativa restringida ^{[ aclaración necesaria ]} no debe confundirse con la expectativa condicional . ${\textstyle \operatorname {E} [X;A]}$ ${\textstyle \operatorname {E} [X\mid A]={\frac {\operatorname {E} [X;A]}{\mathbf {P} (A)}}}$

Comentarios [ editar ]

Prueba de CLT clásico [ editar ]

El teorema del límite central tiene una demostración mediante funciones características . ^[16] Es similar a la prueba de la ley (débil) de los grandes números .

Suponga que son variables aleatorias independientes e idénticamente distribuidas, cada una con varianza media y finita . La suma tiene media y varianza . Considere la variable aleatoria ${\textstyle \{X_{1},\ldots ,X_{n}\}}$ ${\textstyle \mu }$ ${\textstyle \sigma ^{2}}$ ${\textstyle X_{1}+\cdots +X_{n}}$ ${\textstyle n\mu }$ ${\textstyle n\sigma ^{2}}$

Z_{n}\ =\ {\frac {X_{1}+\cdots +X_{n}-n\mu }{\sqrt {n\sigma ^{2}}}}\ =\ \sum _{i=1}^{n}{\frac {X_{i}-\mu }{\sqrt {n\sigma ^{2}}}}\ =\ \sum _{i=1}^{n}{\frac {1}{\sqrt {n}}}Y_{i},

donde en el último paso definimos las nuevas variables aleatorias , cada una con media cero y varianza unitaria ( ). La función característica de está dada por ${\textstyle Y_{i}={\frac {X_{i}-\mu }{\sigma }}}$ ${\textstyle \operatorname {var} (Y)=1}$ ${\textstyle Z_{n}}$

\varphi _{Z_{n}}\!(t)\ =\ \varphi _{\sum _{i=1}^{n}{{\frac {1}{\sqrt {n}}}Y_{i}}}\!(t)\ =\ \varphi _{Y_{1}}\!\!\left({\frac {t}{\sqrt {n}}}\right)\varphi _{Y_{2}}\!\!\left({\frac {t}{\sqrt {n}}}\right)\cdots \varphi _{Y_{n}}\!\!\left({\frac {t}{\sqrt {n}}}\right)\ =\ \left[\varphi _{Y_{1}}\!\!\left({\frac {t}{\sqrt {n}}}\right)\right]^{n},

donde en el último paso usamos el hecho de que todos están distribuidos de manera idéntica. La función característica de es, según el teorema de Taylor , ${\textstyle Y_{i}}$ ${\textstyle Y_{1}}$

\varphi _{Y_{1}}\!\!\left({\frac {t}{\sqrt {n}}}\right)\ =\ 1-{\frac {t^{2}}{2n}}+o\!\!\left({\frac {t^{2}}{n}}\right),\quad {\bigg (}{\frac {t}{\sqrt {n}}}{\bigg )}\rightarrow 0

donde es " pequeña notación o " para alguna función de que va a cero más rápidamente que . Por el límite de la función exponencial ( ), la función característica de igual ${\textstyle o(t^{2}/n)}$ ${\textstyle t}$ ${\textstyle t^{2}/n}$ ${\textstyle e^{x}=\lim _{n\to \infty }\left(1+{\frac {x}{n}}\right)^{n}}$ $Z_{n}$

\varphi _{Z_{n}}(t)=\left(1-{\frac {t^{2}}{2n}}+o\left({\frac {t^{2}}{n}}\right)\right)^{n}\rightarrow e^{-{\frac {1}{2}}t^{2}},\quad n\rightarrow \infty .

Todos los términos de orden superior desaparecen en el límite . El lado derecho es igual a la función característica de una distribución normal estándar , lo que implica través teorema de la continuidad de Lévy que la distribución de abordará como . Por lo tanto, el promedio de la muestra ${\textstyle n\to \infty }$ ${\textstyle N(0,1)}$ ${\textstyle Z_{n}}$ ${\textstyle N(0,1)}$ ${\textstyle n\to \infty }$

{\bar {X}}_{n}={\frac {X_{1}+\cdots +X_{n}}{n}}

es tal que

{\frac {\sqrt {n}}{\sigma }}({\bar {X}}_{n}-\mu )

converge a la distribución normal , de la cual se sigue el teorema del límite central. ${\textstyle N(0,1)}$

Convergencia al límite [ editar ]

El teorema del límite central da solo una distribución asintótica . Como aproximación para un número finito de observaciones, proporciona una aproximación razonable solo cuando está cerca del pico de la distribución normal; requiere una gran cantidad de observaciones para extenderse hacia las colas. ^{[ cita requerida ]}

La convergencia en el teorema del límite central es uniforme porque la función de distribución acumulativa limitante es continua. Si el tercer momento central existe y es finito, entonces la velocidad de convergencia es al menos del orden de (véase el teorema de Berry-Esseen ). El método de Stein ^[17] puede usarse no solo para probar el teorema del límite central, sino también para proporcionar límites en las tasas de convergencia para métricas seleccionadas. ^[18] ${\textstyle \operatorname {E} [(X_{1}-\mu )^{3}]}$ ${\textstyle 1/{\sqrt {n}}}$

La convergencia a la distribución normal es monótona, en el sentido de que la entropía de aumenta monótonamente a la de la distribución normal. ^[19] ${\textstyle Z_{n}}$

El teorema del límite central se aplica en particular a sumas de variables aleatorias discretas independientes e idénticamente distribuidas . Una suma de variables aleatorias discretas sigue siendo una variable aleatoria discreta , de modo que nos enfrentamos a una secuencia de variables aleatorias discretas cuya función de distribución de probabilidad acumulada converge hacia una función de distribución de probabilidad acumulada correspondiente a una variable continua (es decir, la de la distribución normal ) . Esto significa que si construimos un histograma de las realizaciones de la suma de $n$ Variables discretas idénticas independientes, la curva que une los centros de las caras superiores de los rectángulos que forman el histograma converge hacia una curva gaussiana cuando $n se$ acerca al infinito, esta relación se conoce como teorema de Moivre-Laplace . El artículo de distribución binomial detalla tal aplicación del teorema del límite central en el caso simple de una variable discreta que toma solo dos valores posibles.

Relación con la ley de los grandes números [ editar ]

La ley de los grandes números y el teorema del límite central son soluciones parciales a un problema general: "¿Cuál es el comportamiento limitante de $S n$ cuando $n se$ acerca al infinito?" En el análisis matemático, las series asintóticas son una de las herramientas más populares empleadas para abordar tales cuestiones.

Supongamos que tenemos una expansión asintótica de : ${\textstyle f(n)}$

f(n)=a_{1}\varphi _{1}(n)+a_{2}\varphi _{2}(n)+O{\big (}\varphi _{3}(n){\big )}\qquad (n\rightarrow \infty ).

Dividir ambas partes por $φ 1 (n)$ y tomar el límite producirá $un 1$ , el coeficiente del término de mayor orden en la expansión, que representa la tasa a la que $f (n)$ cambia en su término principal.

\lim _{n\to \infty }{\frac {f(n)}{\varphi _{1}(n)}}=a_{1}.

De manera informal, se puede decir: " $f (n)$ crece aproximadamente como $un 1 φ 1 (n)$ ". Tomando la diferencia entre $f (n)$ y su aproximación y luego dividiendo por el siguiente término en la expansión, llegamos a un enunciado más refinado sobre $f (n)$ :

\lim _{n\to \infty }{\frac {f(n)-a_{1}\varphi _{1}(n)}{\varphi _{2}(n)}}=a_{2}.

Aquí se puede decir que la diferencia entre la función y su aproximación crece aproximadamente como $un 2 φ 2 (n)$ . La idea es que dividir la función por funciones normalizadoras apropiadas y observar el comportamiento limitante del resultado puede decirnos mucho sobre el comportamiento limitante de la función original en sí.

De manera informal, algo en este sentido sucede cuando la suma, $S n$ , de variables aleatorias independientes distribuidas de manera idéntica, $X 1,\dots, X n$ , se estudia en la teoría de probabilidad clásica. ^{[ cita requerida ]} Si cada $X i$ tiene una media finita $μ$ , entonces por la ley de los grandes números, $S n / norte \to μ$ . ^[20] Si además cada $X i$ tiene varianza finita $σ 2$ , entonces según el teorema del límite central,

{\frac {S_{n}-n\mu }{\sqrt {n}}}\rightarrow \xi ,

donde $ξ$ se distribuye como $N (0, σ 2)$ . Esto proporciona valores de las dos primeras constantes en la expansión informal

S_{n}\approx \mu n+\xi {\sqrt {n}}.

En el caso de que $X i$ no tenga media o varianza finita, la convergencia de la suma desplazada y reescalada también puede ocurrir con diferentes factores de centrado y escala:

{\frac {S_{n}-a_{n}}{b_{n}}}\rightarrow \Xi ,

o informalmente

S_{n}\approx a_{n}+\Xi b_{n}.

Las distribuciones $Ξ$ que pueden surgir de esta forma se denominan estables . ^[21] Claramente, la distribución normal es estable, pero también hay otras distribuciones estables, como la distribución de Cauchy , para las que la media o la varianza no están definidas. El factor de escala $b n$ puede ser proporcional $an c$ , para cualquier $c \geq 1 / 2$ ; también puede multiplicarse por una función de $n que$ varía lentamente . ^[11]^[22]

La ley del logaritmo iterado especifica lo que está sucediendo "entre" la ley de los grandes números y el teorema del límite central. Específicamente dice que la función de normalización $\sqrt n log log n$ , de tamaño intermedio entre $n$ de la ley de los grandes números y $\sqrt n$ del teorema del límite central, proporciona un comportamiento limitante no trivial.

Enunciados alternativos del teorema [ editar ]

Funciones de densidad [ editar ]

La densidad de la suma de dos o más variables independientes es la convolución de sus densidades (si estas densidades existen). Por tanto, el teorema del límite central puede interpretarse como un enunciado sobre las propiedades de las funciones de densidad en convolución: la convolución de varias funciones de densidad tiende a la densidad normal a medida que el número de funciones de densidad aumenta sin límite. Estos teoremas requieren hipótesis más fuertes que las formas del teorema del límite central dadas anteriormente. Los teoremas de este tipo a menudo se denominan teoremas del límite local. Véase Petrov ^[23] para conocer un teorema de límite local particular para sumas de variables aleatorias independientes e idénticamente distribuidas .

Funciones características [ editar ]

Dado que la función característica de una convolución es el producto de las funciones características de las densidades involucradas, el teorema del límite central tiene otra reformulación más: el producto de las funciones características de varias funciones de densidad se acerca a la función característica de la densidad normal a medida que el número de funciones de densidad aumenta sin límite, en las condiciones indicadas anteriormente. Específicamente, se debe aplicar un factor de escala apropiado al argumento de la función característica.

Se puede hacer una afirmación equivalente sobre las transformadas de Fourier , ya que la función característica es esencialmente una transformada de Fourier.

Calculando la varianza [ editar ]

Sea $S n$ la suma de $n$ variables aleatorias. Muchos teoremas del límite central proporcionan condiciones tales que $S n / \sqrt Var (S n)$ converge en distribución a $N (0,1)$ (la distribución normal con media 0, varianza 1) cuando $n \to \infty$ . En algunos casos, es posible encontrar una constante $σ 2$ y una función $f (n)$ tal que $S n / (σ \sqrt n\cdotf (n))$ converja en distribución a $N (0,1)$ como $n \to \infty$ .

Lema. ^[24] Supongamos que es una secuencia de variables aleatorias valores reales y estrictamente estacionarias con para todos , y . Construir $X_{1},X_{2},\dots$ $\mathbb {E} (X_{i})=0$ $i$ $g:[0,1]\rightarrow \mathbb {R}$ $S_{n}=\sum _{i=1}^{n}g({\tfrac {i}{n}})X_{i}$
$\sigma ^{2}=\mathbb {E} (X_{1}^{2})+2\sum _{i=1}^{\infty }\mathbb {E} (X_{1}X_{1+i})$
Si es absolutamente convergente , y luego como dónde . $\sum _{i=1}^{\infty }\mathbb {E} (X_{1}X_{1+i})$ $\left|\int _{0}^{1}g(x)g'(x)\,dx\right|<\infty$ $0<\int _{0}^{1}(g(x))^{2}dx<\infty$ $\mathrm {Var} (S_{n})/(n\gamma _{n})\rightarrow \sigma ^{2}$ $n\rightarrow \infty$ $\gamma _{n}={\frac {1}{n}}\sum _{i=1}^{n}(g({\tfrac {i}{n}}))^{2}$
Si además y converge en distribución a como, entonces también converge en distribución a como . $\sigma >0$ $S_{n}/{\sqrt {\mathrm {Var} (S_{n})}}$ ${\mathcal {N}}(0,1)$ $n\rightarrow \infty$ $S_{n}/(\sigma {\sqrt {n\gamma _{n}}})$ ${\mathcal {N}}(0,1)$ $n\rightarrow \infty$

Extensiones [ editar ]

Productos de variables aleatorias positivas [ editar ]

El logaritmo de un producto es simplemente la suma de los logaritmos de los factores. Por lo tanto, cuando el logaritmo de un producto de variables aleatorias que toman solo valores positivos se acerca a una distribución normal, el producto en sí se acerca a una distribución logarítmica normal . Muchas cantidades físicas (especialmente la masa o la longitud, que son una cuestión de escala y no pueden ser negativas) son el producto de diferentes factores aleatorios , por lo que siguen una distribución logarítmica normal. Esta versión multiplicativa del teorema del límite central a veces se denomina ley de Gibrat .

Mientras que el teorema del límite central para sumas de variables aleatorias requiere la condición de varianza finita, el teorema correspondiente para productos requiere la condición correspondiente de que la función de densidad sea integrable al cuadrado. ^[25]

Más allá del marco clásico [ editar ]

La normalidad asintótica, es decir, la convergencia a la distribución normal después de un cambio y un cambio de escala apropiados, es un fenómeno mucho más general que el marco clásico tratado anteriormente, es decir, sumas de variables aleatorias independientes (o vectores). De vez en cuando se revelan nuevos marcos; no hay un marco unificador único disponible por ahora.

Cuerpo convexo [ editar ]

Teorema. Existe una secuencia $ε n ↓ 0$ para la que se cumple lo siguiente. Sea $n \geq 1$ , y deje que las variables aleatorias $X 1,\dots, X n$ tengan una densidad conjunta logarítmica-cóncava $f$ tal que $f$ $($ $x$ $1$ $,\dots,$ $x$ $n$ $) =$ $f$ $(|$ $x$ $1$ $|,\dots, |$ $x$ $n$ $| )$ para todo $x$ $1$ $,\dots,$ $x$ $n$ y $E ($ $X$ $2 k) = 1$ para todo $k = 1,\dots, n$ . Entonces la distribución de
${\frac {X_{1}+\cdots +X_{n}}{\sqrt {n}}}$
es $ε n$ -cerca de $N (0,1)$ en la distancia de variación total . ^[26]

Estas dos distribuciones $ε n-$ cercanas tienen densidades (de hecho, densidades log-cóncavas), por lo tanto, la distancia de varianza total entre ellas es la integral del valor absoluto de la diferencia entre las densidades. La convergencia en la variación total es más fuerte que la convergencia débil.

Un ejemplo importante de densidad logarítmica-cóncava es una función constante dentro de un cuerpo convexo dado y que desaparece en el exterior; corresponde a la distribución uniforme en el cuerpo convexo, lo que explica el término "teorema del límite central para cuerpos convexos".

Otro ejemplo: $f (x 1,\dots, x n) = const \cdot exp (- (| x 1 | α +\dots + | x n | α) β)$ donde $α > 1$ y $αβ > 1$ . Si $β = 1$ entonces $f (x 1,\dots, x n) se$ factoriza en $const \cdot exp (- | x 1 | α)\dots exp (- | x n | α),$ lo que significa que $X 1,\dots, X n$ son independientes. En general, sin embargo, son dependientes.

La condición $f (x 1,\dots, x n) = f (| x 1 |,\dots, | x n |)$ asegura que $X 1,\dots, X n$ son de media cero y no correlacionados ; ^{[ cita requerida ]} aún, no necesitan ser independientes, ni siquiera independientes por pares . ^{[ cita requerida ]} Por cierto, la independencia por pares no puede reemplazar la independencia en el teorema del límite central clásico. ^[27]

Aquí hay un resultado tipo Berry-Esseen .

Teorema. Deje que $X 1,\dots, X n$ satisfaga los supuestos del teorema anterior, entonces ^[28]
$\left|\mathbb {P} \left(a\leq {\frac {X_{1}+\cdots +X_{n}}{\sqrt {n}}}\leq b\right)-{\frac {1}{\sqrt {2\pi }}}\int _{a}^{b}\mathrm {e} ^{-{\frac {1}{2}}t^{2}}\,dt\right|\leq {\frac {C}{n}}$
para todo $a < b$ ; aquí $C$ es una constante universal (absoluta) . Además, para cada $c 1,\dots, c n \in ℝ$ tal que $c 21 +\dots + C 2 n = 1$ ,
$\left|\mathbb {P} \left(a\leq c_{1}X_{1}+\cdots +c_{n}X_{n}\leq b\right)-{\frac {1}{\sqrt {2\pi }}}\int _{a}^{b}\mathrm {e} ^{-{\frac {1}{2}}t^{2}}\,dt\right|\leq C\left(c_{1}^{4}+\dots +c_{n}^{4}\right).$

La distribución de $X 1 +\dots + X n / \sqrt n$ no es necesario que sea aproximadamente normal (de hecho, puede ser uniforme). ^[29] Sin embargo, la distribución de $c 1 X 1 +\dots + c n X n$ es cercana a $N (0,1)$ (en la distancia de variación total) para la mayoría de los vectores $(c 1,\dots, c n)$ según el distribución uniforme en la esfera $c 21 +\dots + C 2 n = 1$ .

Serie trigonométrica lacunar [ editar ]

Teorema ( Salem - Zygmund ): Sea $U$ una variable aleatoria distribuida uniformemente en $(0,2π)$ , y $X k = r k cos (n k U + a k)$ , donde
$n k$ satisfacen la condición de lacunaridad: existe $q > 1$ tal que $n k + 1 \geq qn k$ para todo $k$ ,
$r k$ son tales que
$r_{1}^{2}+r_{2}^{2}+\cdots =\infty \quad {\text{ and }}\quad {\frac {r_{k}^{2}}{r_{1}^{2}+\cdots +r_{k}^{2}}}\to 0,$
$0 \leq a k <2π$ .
Entonces ^[30]^[31]
${\frac {X_{1}+\cdots +X_{k}}{\sqrt {r_{1}^{2}+\cdots +r_{k}^{2}}}}$
converge en distribución a $N (0, 1 / 2)$ .

Politopos gaussianos [ editar ]

Teorema: Sean $A 1,\dots, A n$ puntos aleatorios independientes en el plano $ℝ 2,$ cada uno $de los$ cuales tiene la distribución normal estándar bidimensional. Sea $K n$ el casco convexo de estos puntos y $X n$ el área de $K n$ Entonces ^[32]
${\frac {X_{n}-\mathrm {E} (X_{n})}{\sqrt {\operatorname {Var} (X_{n})}}}$
converge en distribución a $N (0,1)$ cuando $n$ tiende a infinito.

Lo mismo también se aplica en todas las dimensiones superiores a 2.

El politopo $K n$ se denomina politopo aleatorio gaussiano.

Un resultado similar es válido para el número de vértices (del politopo gaussiano), el número de aristas y, de hecho, las caras de todas las dimensiones. ^[33]

Funciones lineales de matrices ortogonales [ editar ]

Una función lineal de una matriz $M$ es una combinación lineal de sus elementos (con coeficientes dados), $M \mapsto tr (AM)$ donde $A$ es la matriz de los coeficientes; ver Traza (álgebra lineal) # Producto interno .

Se dice que una matriz ortogonal aleatoria se distribuye uniformemente, si su distribución es la medida de Haar normalizada en el grupo ortogonal $O (n, ℝ)$ ; ver Matriz de rotación # Matrices de rotación aleatorias uniformes .

Teorema. Sea $M$ una matriz aleatoria ortogonal $n \times n$ distribuida uniformemente, y $A$ una matriz fija $n \times n$ tal que $tr (AA *) = n$ , y sea $X = tr (AM)$ . Entonces ^[34] la distribución de $X$ es cercana a $N (0,1)$ en la métrica de variación total hasta ^{[ aclaración necesaria ]} $2 \sqrt 3 / n - 1$ .

Subsecuencias [ editar ]

Teorema. Deje que las variables aleatorias $X 1, X 2,\dots \in L 2 (Ω)$ sean tales que $X n \to 0$ débilmente en $L 2 (Ω)$ y $X norte \to 1$ débilmente en $L 1 (Ω)$ . Entonces existen enteros $n 1 < n 2 <\dots$ tales que
${\frac {X_{n_{1}}+\cdots +X_{n_{k}}}{\sqrt {k}}}$
converge en distribución a $N (0,1)$ cuando $k$ tiende a infinito. ^[35]

Caminata aleatoria sobre una celosía de cristal [ editar ]

El teorema del límite central puede establecerse para la caminata aleatoria simple sobre una red cristalina (un gráfico de cobertura abeliano de pliegues infinitos sobre un gráfico finito) y se utiliza para el diseño de estructuras cristalinas.^[36]^[37]

Aplicaciones y ejemplos [ editar ]

Ejemplo simple [ editar ]

Esta figura demuestra el teorema del límite central. Las medias de la muestra se generan utilizando un generador de números aleatorios, que extrae números entre 0 y 100 a partir de una distribución de probabilidad uniforme. Ilustra que el aumento del tamaño de la muestra da como resultado que las 500 medias de muestra medidas se distribuyan más estrechamente sobre la media de la población (50 en este caso). También compara las distribuciones observadas con las distribuciones que se esperarían para una distribución gaussiana normalizada, y muestra los valores de chi-cuadrado que cuantifican la bondad del ajuste (el ajuste es bueno si el chi-cuadrado reducidovalor es menor o aproximadamente igual a uno). La entrada en la función gaussiana normalizada es la media de las medias muestrales (~ 50) y la desviación estándar media de la muestra dividida por la raíz cuadrada del tamaño de la muestra (~ 28,87 /

\sqrt n

), que se denomina desviación estándar de la media ( ya que se refiere a la dispersión de las medias muestrales).

Un ejemplo simple del teorema del límite central es tirar muchos dados idénticos e insesgados. La distribución de la suma (o promedio) de los números lanzados estará bien aproximada por una distribución normal. Dado que las cantidades del mundo real a menudo son la suma equilibrada de muchos eventos aleatorios no observados, el teorema del límite central también proporciona una explicación parcial de la prevalencia de la distribución de probabilidad normal. También justifica la aproximación de estadísticas de muestras grandes a la distribución normal en experimentos controlados.

Comparación de funciones de densidad de probabilidad,

** p (k)

para que la suma de

n

dados de 6 lados justos muestre su convergencia a una distribución normal con

n

creciente , de acuerdo con el teorema del límite central. En el gráfico inferior derecho, los perfiles suavizados de los gráficos anteriores se reescalan, se superponen y se comparan con una distribución normal (curva negra).

Otra simulación usando la distribución binomial. Se generaron 0 y 1 aleatorios, y luego se calcularon sus medias para tamaños de muestra que van de 1 a 512. Tenga en cuenta que a medida que aumenta el tamaño de la muestra, las colas se vuelven más delgadas y la distribución se concentra más alrededor de la media.

Aplicaciones reales [ editar ]

La literatura publicada contiene una serie de ejemplos y aplicaciones útiles e interesantes relacionados con el teorema del límite central. ^[38] Una fuente ^[39] indica los siguientes ejemplos:

La distribución de probabilidad para la distancia total cubierta en una caminata aleatoria (sesgada o insesgada) tenderá hacia una distribución normal .
Lanzar muchas monedas dará como resultado una distribución normal del número total de caras (o equivalentemente el número total de cruces).

Desde otro punto de vista, el teorema del límite central explica la apariencia común de la "curva de campana" en las estimaciones de densidad aplicadas a datos del mundo real. En casos como el ruido electrónico, las calificaciones de los exámenes, etc., a menudo podemos considerar un único valor medido como el promedio ponderado de muchos efectos pequeños. Usando generalizaciones del teorema del límite central, podemos ver que esto a menudo (aunque no siempre) produciría una distribución final que es aproximadamente normal.

En general, cuanto más se asemeja una medición a la suma de variables independientes con igual influencia en el resultado, más normalidad presenta. Esto justifica el uso común de esta distribución para reemplazar los efectos de las variables no observadas en modelos como el modelo lineal .

Regresión [ editar ]

El análisis de regresión y, en particular, los mínimos cuadrados ordinarios especifican que una variable dependiente depende, según alguna función, de una o más variables independientes , con un término de error aditivo . Varios tipos de inferencia estadística sobre la regresión asumen que el término de error tiene una distribución normal. Esta suposición se puede justificar asumiendo que el término de error es en realidad la suma de muchos términos de error independientes; incluso si los términos de error individuales no se distribuyen normalmente, según el teorema del límite central, su suma puede aproximarse bien mediante una distribución normal.

Otras ilustraciones [ editar ]

Dada su importancia para la estadística, se encuentran disponibles varios artículos y paquetes de computadora que demuestran la convergencia involucrada en el teorema del límite central. ^[40]

Historia [ editar ]

El matemático holandés Henk Tijms escribe: ^[41]

El teorema del límite central tiene una historia interesante. La primera versión de este teorema fue postulada por el matemático nacido en Francia Abraham de Moivre quien, en un notable artículo publicado en 1733, utilizó la distribución normal para aproximar la distribución del número de caras resultante de muchos lanzamientos de una moneda en blanco. Este hallazgo se adelantó a su tiempo y estuvo casi olvidado hasta que el famoso matemático francés Pierre-Simon Laplace lo rescató de la oscuridad en su monumental obra Théorie analytique des probabilités., que se publicó en 1812. Laplace amplió el hallazgo de De Moivre al aproximar la distribución binomial con la distribución normal. Pero al igual que con De Moivre, el hallazgo de Laplace recibió poca atención en su propio tiempo. No fue hasta el final del siglo XIX que se discernió la importancia del teorema del límite central, cuando, en 1901, el matemático ruso Aleksandr Lyapunov lo definió en términos generales y demostró con precisión cómo funcionaba matemáticamente. Hoy en día, se considera que el teorema del límite central es el soberano no oficial de la teoría de la probabilidad.

Sir Francis Galton describió el teorema del límite central de esta manera: ^[42]

Apenas conozco algo tan apto para impresionar a la imaginación como la maravillosa forma de orden cósmico expresada por la "Ley de Frecuencia de Error". La ley habría sido personificada por los griegos y divinizada, si la hubieran conocido. Reina con serenidad y con total modestia, en medio de la confusión más salvaje. Cuanto más grande es la mafia y mayor la aparente anarquía, más perfecta es su influencia. Es la ley suprema de la sinrazón. Siempre que se toma una gran muestra de elementos caóticos y se ordena en el orden de su magnitud, una forma de regularidad insospechada y más hermosa demuestra haber estado latente todo el tiempo.

El término actual "teorema del límite central" (en alemán: "zentraler Grenzwertsatz") fue utilizado por primera vez por George Pólya en 1920 en el título de un artículo. ^[43]^[44] Pólya se refirió al teorema como "central" debido a su importancia en la teoría de la probabilidad. Según Le Cam, la escuela francesa de probabilidad interpreta la palabra central en el sentido de que "describe el comportamiento del centro de la distribución en oposición a sus colas". ^[44] El resumen del artículo Sobre el teorema del límite central del cálculo de probabilidad y el problema de los momentos de Pólya ^[43] en 1920 se traduce de la siguiente manera.

La ocurrencia de la densidad de probabilidad gaussiana $1 = e - x 2$ en experimentos repetidos, en errores de medición, que resultan en la combinación de muchos y muy pequeños errores elementales, en procesos de difusión, etc., se puede explicar, como también: conocido, por el mismo teorema del límite, que juega un papel central en el cálculo de probabilidad. El verdadero descubridor de este teorema del límite se llamará Laplace; es probable que Tschebyscheff haya dado por primera vez su prueba rigurosa y que su formulación más nítida se pueda encontrar, hasta donde yo sé, en un artículo de Liapounoff . ...

Hald proporciona una descripción completa de la historia del teorema, detallando el trabajo fundamental de Laplace, así como las contribuciones de Cauchy , Bessel y Poisson . ^[45] Dos relatos históricos, uno que cubre el desarrollo de Laplace a Cauchy, el segundo las contribuciones de von Mises , Pólya , Lindeberg , Lévy y Cramér durante la década de 1920, son dados por Hans Fischer. ^[46] Le Cam describe un período alrededor de 1935. ^[44] Bernstein ^[47] presenta una discusión histórica centrada en el trabajo de Pafnuty Chebyshevy sus alumnos Andrey Markov y Aleksandr Lyapunov que llevaron a las primeras pruebas del CLT en un entorno general.

Una nota a pie de página curiosa sobre la historia del teorema del límite central es que una prueba de un resultado similar al CLT de Lindeberg de 1922 fue el tema de la disertación de beca de Alan Turing de 1934 para el King's College de la Universidad de Cambridge . Solo después de enviar el trabajo, Turing se enteró de que ya había sido probado. En consecuencia, la tesis de Turing no se publicó. ^[48]

Ver también [ editar ]

Propiedad de equipartición asintótica
Distribución asintótica
Distribución Bates
Ley de Benford : resultado de la extensión de CLT al producto de variables aleatorias.
Teorema de Berry-Esseen
Teorema del límite central para la estadística direccional : teorema del límite central aplicado al caso de la estadística direccional
Método delta : para calcular la distribución límite de una función de una variable aleatoria.
Teorema de Erdős-Kac : conecta el número de factores primos de un número entero con la distribución de probabilidad normal
Teorema de Fisher-Tippett-Gnedenko: teorema del límite para valores extremos (como $max {X n$ })
Distribución Irwin-Hall
Teorema del límite central de la cadena de Markov
Distribución normal
Teorema de convergencia Tweedie : un teorema que puede considerarse un puente entre el teorema del límite central y el teorema de convergencia de Poisson ^[49]

Notas [ editar ]

^ Montgomery, Douglas C .; Runger, George C. (2014). Estadística aplicada y probabilidad para ingenieros (6ª ed.). Wiley. pag. 241. ISBN 9781118539712.
^ Rouaud, Mathieu (2013). Probabilidad, estadística y estimación (PDF) . pag. 10.
^ Billingsley (1995, p. 357)
↑ Bauer (2001, Teorema 30.13, p.199)
↑ Billingsley (1995, p. 362)
↑ van der Vaart, AW (1998). Estadística asintótica . Nueva York, NY: Cambridge University Press. ISBN 978-0-521-49603-2. LCCN 98015176 .
^ O'Donnell, Ryan (2014). "Teorema 5.38" .
^ Bentkus, V. (2005). "Un tipo Lyapunov enlazado ". Teoría Probab. Apl . 49 (2): 311–323. doi : 10.1137 / S0040585X97981123 . $\;{\mathbb {R} }^{d}\;$
^ Voit, Johannes (2003). "Sección f5.4.3" . La mecánica estadística de los mercados financieros . Textos y monografías en física. Springer-Verlag. ISBN 3-540-00978-7.
^ Gnedenko, BV; Kolmogorov, AN (1954). Limite las distribuciones para sumas de variables aleatorias independientes . Cambridge: Addison-Wesley.
↑ a b Uchaikin, Vladimir V .; Zolotarev, VM (1999). Oportunidad y estabilidad: distribuciones estables y sus aplicaciones . VSP. págs. 61–62. ISBN 90-6764-301-7.
↑ Billingsley (1995, Teorema 27.5)
↑ Durrett (2004, Sect. 7.7 (c), Teorema 7.8)
↑ Durrett (2004, Sect. 7.7, Teorema 7.4)
^ Billingsley (1995, Teorema 35.12)
^ "Introducción a los procesos estocásticos en física" . jhupbooks.press.jhu.edu . Consultado el 11 de agosto de 2016 .
^ Stein, C. (1972). "Un límite para el error en la aproximación normal a la distribución de una suma de variables aleatorias dependientes" . Actas del sexto simposio de Berkeley sobre estadística matemática y probabilidad : 583–602. Señor 0402873 . Zbl 0278.60026 .
^ Chen, LHY; Goldstein, L .; Shao, QM (2011). Aproximación normal por el método de Stein . Saltador. ISBN 978-3-642-15006-7.
^ Artstein, S .; Ball, K .; Barthe, F .; Naor, A. (2004), "Solución del problema de Shannon sobre la monotonicidad de la entropía" , Journal of the American Mathematical Society , 17 (4): 975–982, doi : 10.1090 / S0894-0347-04-00459-X
^ Rosenthal, Jeffrey Seth (2000). Un primer vistazo a la teoría de la probabilidad rigurosa . World Scientific. Teorema 5.3.4, pág. 47. ISBN 981-02-4322-7.
^ Johnson, Oliver Thomas (2004). Teoría de la información y teorema del límite central . Prensa del Imperial College. pag. 88. ISBN 1-86094-473-6.
^ Borodin, AN; Ibragimov, IA; Sudakov, VN (1995). Teoremas de límites para las funciones de los paseos aleatorios . Librería AMS. Teorema 1.1, pág. 8. ISBN 0-8218-0438-3.
^ Petrov, VV (1976). Sumas de variables aleatorias independientes . Nueva York-Heidelberg: Springer-Verlag. ch. 7. ISBN 9783642658099.
^ Hew, Patrick Chisan (2017). "Distribución asintótica de recompensas acumuladas por procesos de renovación alternos". Estadísticas y letras de probabilidad . 129 : 355–359. doi : 10.1016 / j.spl.2017.06.027 .
^ Rempala, G .; Wesolowski, J. (2002). "Asintóticas de productos de sumas y estadísticas U " (PDF) . Comunicaciones electrónicas en probabilidad . 7 : 47–54. doi : 10.1214 / ecp.v7-1046 .
↑ Klartag (2007, Teorema 1.2)
^ Durrett (2004, sección 2.4, ejemplo 4.5)
↑ Klartag (2008, Teorema 1)
↑ Klartag (2007, Teorema 1.1)
^ Zygmund, Antoni (2003) [1959]. Serie trigonométrica . Prensa de la Universidad de Cambridge. vol. II, secc. XVI.5, Teorema 5-5. ISBN 0-521-89053-5.
↑ Gaposhkin (1966, Teorema 2.1.13)
↑ Bárány y Vu (2007, Teorema 1.1)
↑ Bárány y Vu (2007, Teorema 1.2)
^ Meckes, Elizabeth (2008). "Funciones lineales sobre los grupos de matrices clásicas". Transacciones de la American Mathematical Society . 360 (10): 5355–5366. arXiv : matemáticas / 0509441 . doi : 10.1090 / S0002-9947-08-04444-9 . S2CID 11981408 .
↑ Gaposhkin (1966, secc. 1.5)
↑ Kotani, M .; Sunada, Toshikazu (2003). Geometría espectral de celosías cristalinas . 338 . Matemáticas contemporáneas. págs. 271-305. ISBN 978-0-8218-4269-0.
^ Sunada, Toshikazu (2012). Cristalografía topológica: con miras al análisis geométrico discreto . Encuestas y Tutorías en las Ciencias Matemáticas Aplicadas. 6 . Saltador. ISBN 978-4-431-54177-6.
^ Dinov, Christou y Sánchez (2008)
^ "Aplicaciones de GCLT de actividades SOCR EduMaterials - Socr" . Wiki.stat.ucla.edu . 2010-05-24 . Consultado el 23 de enero de 2017 .
^ Marasinghe, M .; Meeker, W .; Cook, D .; Shin, TS (agosto de 1994). "Utilización de gráficos y simulación para enseñar conceptos estadísticos". Documento presentado en la reunión anual de la American Statistician Association, Toronto, Canadá. Cite journal requires |journal= (help)
^ Henk, Tijms (2004). Comprensión de la probabilidad: reglas de azar en la vida cotidiana . Cambridge: Cambridge University Press. pag. 169. ISBN 0-521-54036-4.
^ Galton, F. (1889). Herencia natural . pag. 66.
↑ a b Pólya, George (1920). "Über den zentralen Grenzwertsatz der Wahrscheinlichkeitsrechnung und das Momentenproblem" [Sobre el teorema del límite central del cálculo de probabilidades y el problema de los momentos]. Mathematische Zeitschrift (en alemán). 8 (3–4): 171–181. doi : 10.1007 / BF01206525 . S2CID 123063388 .
↑ a b c Le Cam, Lucien (1986). "El teorema del límite central alrededor de 1935" . Ciencia estadística . 1 (1): 78–91. doi : 10.1214 / ss / 1177013818 .
^ Hald, Andreas (22 de abril de 1998). Una historia de la estadística matemática de 1750 a 1930 (PDF) . Gbv.de . capítulo 17. ISBN 978-0471179122.
^ Fischer, Hans (2011). Una historia del teorema del límite central: de la teoría de la probabilidad clásica a la moderna . Fuentes y estudios en Historia de las Matemáticas y Ciencias Físicas. Nueva York: Springer. doi : 10.1007 / 978-0-387-87857-7 . ISBN 978-0-387-87856-0. Señor 2743162 . Zbl 1226.60004 . (Capítulo 2: El teorema del límite central de Laplace a Cauchy: cambios en los objetivos estocásticos y en los métodos analíticos, Capítulo 5.2: El teorema del límite central en los años veinte)
^ Bernstein, SN (1945). "Sobre el trabajo de PL Chebyshev en teoría de la probabilidad". En Bernstein., SN (ed.). Nauchnoe Nasledie PL Chebysheva. Vypusk Pervyi: Matematika [ El legado científico de PL Chebyshev. Parte I: Matemáticas ] (en ruso). Moscú y Leningrado: Academiya Nauk SSSR. pag. 174.
^ Zabell, SL (1995). "Alan Turing y el teorema del límite central". American Mathematical Monthly . 102 (6): 483–494. doi : 10.1080 / 00029890.1995.12004608 .
^ Jørgensen, Bent (1997). La teoría de los modelos de dispersión . Chapman y Hall. ISBN 978-0412997112.

Referencias [ editar ]

Bárány, Imre ; Vu, Van (2007). "Teoremas del límite central para politopos gaussianos". Anales de probabilidad . Instituto de Estadística Matemática. 35 (4): 1593-1621. arXiv : matemáticas / 0610192 . doi : 10.1214 / 009117906000000791 . S2CID 9128253 .
Bauer, Heinz (2001). Teoría de la medida e integración . Berlín: de Gruyter. ISBN 3110167190.
Billingsley, Patrick (1995). Probabilidad y medida (3ª ed.). John Wiley e hijos. ISBN 0-471-00710-2.
Bradley, Richard (2007). Introducción a las condiciones de mezcla fuertes (1ª ed.). Heber City, UT: Kendrick Press. ISBN 978-0-9740427-9-4.
Bradley, Richard (2005). "Propiedades básicas de fuertes condiciones de mezcla. Una encuesta y algunas preguntas abiertas". Encuestas de probabilidad . 2 : 107-144. arXiv : matemáticas / 0511078 . Bibcode : 2005math ..... 11078B . doi : 10.1214 / 154957805100000104 . S2CID 8395267 .
Dinov, Ivo; Christou, Nicolas; Sánchez, Juana (2008). "Teorema del límite central: nuevo subprograma SOCR y actividad de demostración" . Revista de Educación en Estadística . COMO UN. 16 (2): 1–15. doi : 10.1080 / 10691898.2008.11889560 . PMC 3152447 . PMID 21833159 .
Durrett, Richard (2004). Probabilidad: teoría y ejemplos (3ª ed.). Prensa de la Universidad de Cambridge. ISBN 0521765390.
Gaposhkin, VF (1966). "Series lacunares y funciones independientes". Encuestas matemáticas rusas . 21 (6): 1–82. Código Bibliográfico : 1966RuMaS..21 .... 1G . doi : 10.1070 / RM1966v021n06ABEH001196 ..
Klartag, Bo'az (2007). "Un teorema de límite central para conjuntos convexos". Inventiones Mathematicae . 168 (1): 91-131. arXiv : matemáticas / 0605014 . Código Bibliográfico : 2007InMat.168 ... 91K . doi : 10.1007 / s00222-006-0028-8 . S2CID 119169773 .
Klartag, Bo'az (2008). "Una desigualdad de tipo Berry-Esseen para cuerpos convexos con una base incondicional". Teoría de la probabilidad y campos relacionados . 145 (1–2): 1–33. arXiv : 0705.0832 . doi : 10.1007 / s00440-008-0158-6 . S2CID 10163322 .

Enlaces externos [ editar ]

Wikimedia Commons tiene medios relacionados con el teorema del límite central .

Teorema del límite central en Khan Academy
"Teorema del límite central" , Encyclopedia of Mathematics , EMS Press , 2001 [1994]
Weisstein, Eric W. "Teorema del límite central" . MathWorld .

[1] Montgomery, Douglas C .; Runger, George C. (2014). Estadística aplicada y probabilidad para ingenieros (6ª ed.). Wiley. pag. 241. ISBN 9781118539712.

[2] Rouaud, Mathieu (2013). Probabilidad, estadística y estimación (PDF) . pag. 10.

[3] Billingsley (1995, p. 357)

[4] Bauer (2001, Teorema 30.13, p.199)

[5] Billingsley (1995, p. 362)

[6] van der Vaart, AW (1998). Estadística asintótica . Nueva York, NY: Cambridge University Press. ISBN 978-0-521-49603-2. LCCN 98015176 .

[7] O'Donnell, Ryan (2014). "Teorema 5.38" .

[8] Bentkus, V. (2005). "Un tipo Lyapunov enlazado ". Teoría Probab. Apl . 49 (2): 311–323. doi : 10.1137 / S0040585X97981123 . $\;{\mathbb {R} }^{d}\;$

[Voit2003a-9] Voit, Johannes (2003). "Sección f5.4.3" . La mecánica estadística de los mercados financieros . Textos y monografías en física. Springer-Verlag. ISBN 3-540-00978-7.

[10] Gnedenko, BV; Kolmogorov, AN (1954). Limite las distribuciones para sumas de variables aleatorias independientes . Cambridge: Addison-Wesley.

[Uchaikin-11] Uchaikin, Vladimir V .; Zolotarev, VM (1999). Oportunidad y estabilidad: distribuciones estables y sus aplicaciones . VSP. págs. 61–62. ISBN 90-6764-301-7.

[12] Billingsley (1995, Teorema 27.5)

[13] Durrett (2004, Sect. 7.7 (c), Teorema 7.8)

[14] Durrett (2004, Sect. 7.7, Teorema 7.4)

[15] Billingsley (1995, Teorema 35.12)

[16] "Introducción a los procesos estocásticos en física" . jhupbooks.press.jhu.edu . Consultado el 11 de agosto de 2016 .

[stein1972-17] Stein, C. (1972). "Un límite para el error en la aproximación normal a la distribución de una suma de variables aleatorias dependientes" . Actas del sexto simposio de Berkeley sobre estadística matemática y probabilidad : 583–602. Señor 0402873 . Zbl 0278.60026 .

[18] Chen, LHY; Goldstein, L .; Shao, QM (2011). Aproximación normal por el método de Stein . Saltador. ISBN 978-3-642-15006-7.

[ABBN-19] Artstein, S .; Ball, K .; Barthe, F .; Naor, A. (2004), "Solución del problema de Shannon sobre la monotonicidad de la entropía" , Journal of the American Mathematical Society , 17 (4): 975–982, doi : 10.1090 / S0894-0347-04-00459-X

[20] Rosenthal, Jeffrey Seth (2000). Un primer vistazo a la teoría de la probabilidad rigurosa . World Scientific. Teorema 5.3.4, pág. 47. ISBN 981-02-4322-7.

[21] Johnson, Oliver Thomas (2004). Teoría de la información y teorema del límite central . Prensa del Imperial College. pag. 88. ISBN 1-86094-473-6.

[22] Borodin, AN; Ibragimov, IA; Sudakov, VN (1995). Teoremas de límites para las funciones de los paseos aleatorios . Librería AMS. Teorema 1.1, pág. 8. ISBN 0-8218-0438-3.

[23] Petrov, VV (1976). Sumas de variables aleatorias independientes . Nueva York-Heidelberg: Springer-Verlag. ch. 7. ISBN 9783642658099.

[24] Hew, Patrick Chisan (2017). "Distribución asintótica de recompensas acumuladas por procesos de renovación alternos". Estadísticas y letras de probabilidad . 129 : 355–359. doi : 10.1016 / j.spl.2017.06.027 .

[Rempala-25] Rempala, G .; Wesolowski, J. (2002). "Asintóticas de productos de sumas y estadísticas U " (PDF) . Comunicaciones electrónicas en probabilidad . 7 : 47–54. doi : 10.1214 / ecp.v7-1046 .

[26] Klartag (2007, Teorema 1.2)

[27] Durrett (2004, sección 2.4, ejemplo 4.5)

[28] Klartag (2008, Teorema 1)

[29] Klartag (2007, Teorema 1.1)

[Zygmund-30] Zygmund, Antoni (2003) [1959]. Serie trigonométrica . Prensa de la Universidad de Cambridge. vol. II, secc. XVI.5, Teorema 5-5. ISBN 0-521-89053-5.

[31] Gaposhkin (1966, Teorema 2.1.13)

[32] Bárány y Vu (2007, Teorema 1.1)

[33] Bárány y Vu (2007, Teorema 1.2)

[Meckes-34] Meckes, Elizabeth (2008). "Funciones lineales sobre los grupos de matrices clásicas". Transacciones de la American Mathematical Society . 360 (10): 5355–5366. arXiv : matemáticas / 0509441 . doi : 10.1090 / S0002-9947-08-04444-9 . S2CID 11981408 .

[35] Gaposhkin (1966, secc. 1.5)

[36] Kotani, M .; Sunada, Toshikazu (2003). Geometría espectral de celosías cristalinas . 338 . Matemáticas contemporáneas. págs. 271-305. ISBN 978-0-8218-4269-0.

[37] Sunada, Toshikazu (2012). Cristalografía topológica: con miras al análisis geométrico discreto . Encuestas y Tutorías en las Ciencias Matemáticas Aplicadas. 6 . Saltador. ISBN 978-4-431-54177-6.

[38] Dinov, Christou y Sánchez (2008)

[39] "Aplicaciones de GCLT de actividades SOCR EduMaterials - Socr" . Wiki.stat.ucla.edu . 2010-05-24 . Consultado el 23 de enero de 2017 .

[Marasinghe-40] Marasinghe, M .; Meeker, W .; Cook, D .; Shin, TS (agosto de 1994). "Utilización de gráficos y simulación para enseñar conceptos estadísticos". Documento presentado en la reunión anual de la American Statistician Association, Toronto, Canadá. Cite journal requires |journal= (help)

[Tijms-41] Henk, Tijms (2004). Comprensión de la probabilidad: reglas de azar en la vida cotidiana . Cambridge: Cambridge University Press. pag. 169. ISBN 0-521-54036-4.

[42] Galton, F. (1889). Herencia natural . pag. 66.

[Polya1920-43] Pólya, George (1920). "Über den zentralen Grenzwertsatz der Wahrscheinlichkeitsrechnung und das Momentenproblem" [Sobre el teorema del límite central del cálculo de probabilidades y el problema de los momentos]. Mathematische Zeitschrift (en alemán). 8 (3–4): 171–181. doi : 10.1007 / BF01206525 . S2CID 123063388 .

[LC1986-44] Le Cam, Lucien (1986). "El teorema del límite central alrededor de 1935" . Ciencia estadística . 1 (1): 78–91. doi : 10.1214 / ss / 1177013818 .

[Hald-45] Hald, Andreas (22 de abril de 1998). Una historia de la estadística matemática de 1750 a 1930 (PDF) . Gbv.de . capítulo 17. ISBN 978-0471179122.

[Fischer-46] Fischer, Hans (2011). Una historia del teorema del límite central: de la teoría de la probabilidad clásica a la moderna . Fuentes y estudios en Historia de las Matemáticas y Ciencias Físicas. Nueva York: Springer. doi : 10.1007 / 978-0-387-87857-7 . ISBN 978-0-387-87856-0. Señor 2743162 . Zbl 1226.60004 . (Capítulo 2: El teorema del límite central de Laplace a Cauchy: cambios en los objetivos estocásticos y en los métodos analíticos, Capítulo 5.2: El teorema del límite central en los años veinte)

[Bernstein-47] Bernstein, SN (1945). "Sobre el trabajo de PL Chebyshev en teoría de la probabilidad". En Bernstein., SN (ed.). Nauchnoe Nasledie PL Chebysheva. Vypusk Pervyi: Matematika [ El legado científico de PL Chebyshev. Parte I: Matemáticas ] (en ruso). Moscú y Leningrado: Academiya Nauk SSSR. pag. 174.

[48] Zabell, SL (1995). "Alan Turing y el teorema del límite central". American Mathematical Monthly . 102 (6): 483–494. doi : 10.1080 / 00029890.1995.12004608 .

[Jørgensen-1997-49] Jørgensen, Bent (1997). La teoría de los modelos de dispersión . Chapman y Hall. ISBN 978-0412997112.

[1]