Medida empírica

En la teoría de la probabilidad , una medida empírica es una medida aleatoria que surge de una realización particular de una secuencia (generalmente finita) de variables aleatorias . La definición precisa se encuentra a continuación. Las medidas empíricas son relevantes para la estadística matemática .

La motivación para estudiar medidas empíricas es que a menudo es imposible conocer la verdadera medida de probabilidad subyacente. ${\ Displaystyle P}$ . Recopilamos observaciones ${\ Displaystyle X_ {1}, X_ {2}, \ dots, X_ {n}}$ y calcular frecuencias relativas . Podemos estimar ${\ Displaystyle P}$ , o una función de distribución relacionada ${\ Displaystyle F}$ mediante la medida empírica o la función de distribución empírica, respectivamente. Se trata de estimaciones uniformemente buenas en determinadas condiciones. Los teoremas en el área de procesos empíricos proporcionan tasas de esta convergencia.

Definición

Dejar ${\ Displaystyle X_ {1}, X_ {2}, \ dots}$ ser una secuencia de independientes idénticamente distribuidas variables aleatorias con valores en el espacio de estados S con distribución de probabilidad P .

Definición

La medida empírica P _n se define para subconjuntos medibles de S y está dada por

{\ Displaystyle P_ {n} (A) = {1 \ sobre n} \ sum _ {i = 1} ^ {n} I_ {A} (X_ {i}) = {\ frac {1} {n}} \ sum _ {i = 1} ^ {n} \ delta _ {X_ {i}} (A)}

dónde

{\ Displaystyle I_ {A}}

es la función del indicador y

{\ Displaystyle \ delta _ {X}}

es la medida de Dirac .

Propiedades

Para un conjunto medible fijo A , nP _n ( A ) es una variable aleatoria binomial con media nP ( A ) y varianza nP ( A ) (1 - P ( A )).
- En particular, P _n ( A ) es un estimador insesgado de P ( A ).
Para una partición fija ${\ Displaystyle A_ {i}}$ de S , variables aleatorias ${\ Displaystyle X_ {i} = nP_ {n} (A_ {i})}$ formar una distribución multinomial con probabilidades de eventos ${\ Displaystyle P (A_ {i})}$
- La matriz de covarianza de esta distribución multinomial es ${\ Displaystyle Cov (X_ {i}, X_ {j}) = nP (A_ {i}) (\ delta _ {ij} -P (A_ {j}))}$ .

Definición

{\ Displaystyle {\ bigl (} P_ {n} (c) {\ bigr)} _ {c \ in {\ mathcal {C}}}}

es la medida empírica indexada por

{\ Displaystyle {\ mathcal {C}}}

, Una colección de subconjuntos medibles de S .

Para generalizar más esta noción, observe que la medida empírica ${\ Displaystyle P_ {n}}$ mapas de funciones medibles ${\ Displaystyle f: S \ to \ mathbb {R}}$ a su medio empírico ,

{\ Displaystyle f \ mapsto P_ {n} f = \ int _ {S} f \, dP_ {n} = {\ frac {1} {n}} \ sum _ {i = 1} ^ {n} f ( X_ {i})}

En particular, la medida empírica de A es simplemente la media empírica de la función indicadora, P _n ( A ) = P _n I _A .

Para una función medible fija ${\ Displaystyle f}$ , ${\ Displaystyle P_ {n} f}$ es una variable aleatoria con media ${\ Displaystyle \ mathbb {E} f}$ y varianza ${\ Displaystyle {\ frac {1} {n}} \ mathbb {E} (f- \ mathbb {E} f) ^ {2}}$ .

Por la fuerte ley de los grandes números , P _n ( A ) converge a P ( A ) casi con seguridad para A fijo . similar ${\ Displaystyle P_ {n} f}$ converge a ${\ Displaystyle \ mathbb {E} f}$ casi seguramente para una función fija y medible ${\ Displaystyle f}$ . El problema de la convergencia uniforme de P _n a P estaba abierto hasta que Vapnik y Chervonenkis lo resolvieron en 1968. ^[1]

Si la clase ${\ Displaystyle {\ mathcal {C}}}$ (o ${\ Displaystyle {\ mathcal {F}}}$ ) es Glivenko-Cantelli con respecto a P, entonces P _n converge a P uniformemente sobre ${\ Displaystyle c \ in {\ mathcal {C}}}$ (o ${\ Displaystyle f \ in {\ mathcal {F}}}$ ). En otras palabras, con probabilidad 1 tenemos

{\ Displaystyle \ | P_ {n} -P \ | _ {\ mathcal {C}} = \ sup _ {c \ in {\ mathcal {C}}} | P_ {n} (c) -P (c) | \ a 0,}

{\ Displaystyle \ | P_ {n} -P \ | _ {\ mathcal {F}} = \ sup _ {f \ in {\ mathcal {F}}} | P_ {n} f- \ mathbb {E} f | \ a 0.}

Función de distribución empírica

La función de distribución empírica proporciona un ejemplo de medidas empíricas. Para variables aleatorias iid de valor real ${\ Displaystyle X_ {1}, \ dots, X_ {n}}$ es dado por

{\ Displaystyle F_ {n} (x) = P_ {n} ((- \ infty, x]) = P_ {n} I _ {(- \ infty, x]}.}

En este caso, las medidas empíricas están indexadas por una clase ${\ Displaystyle {\ mathcal {C}} = \ {(- \ infty, x]: x \ in \ mathbb {R} \}.}$ Se ha demostrado que ${\ Displaystyle {\ mathcal {C}}}$ es una clase uniforme de Glivenko-Cantelli , en particular,

{\ Displaystyle \ sup _ {F} \ | F_ {n} (x) -F (x) \ | _ {\ infty} \ to 0}

con probabilidad 1.

Ver también

Medida aleatoria de Poisson

Referencias

^ Vapnik, V .; Chervonenkis, A (1968). "Convergencia uniforme de frecuencias de ocurrencia de eventos a sus probabilidades". Dokl. Akad. Nauk SSSR . 181 .

Otras lecturas

Billingsley, P. (1995). Probabilidad y medida (tercera ed.). Nueva York: John Wiley and Sons. ISBN 0-471-80478-9.
Donsker, MD (1952). "Justificación y extensión del enfoque heurístico de Doob a los teoremas de Kolmogorov-Smirnov" . Anales de estadística matemática . 23 (2): 277–281. doi : 10.1214 / aoms / 1177729445 .
Dudley, RM (1978). "Teoremas del límite central para medidas empíricas" . Anales de probabilidad . 6 (6): 899–929. doi : 10.1214 / aop / 1176995384 . JSTOR 2243028 .
Dudley, RM (1999). Teoremas uniformes del límite central . Estudios de Cambridge en Matemáticas Avanzadas. 63 . Cambridge, Reino Unido: Cambridge University Press. ISBN 0-521-46102-2.
Wolfowitz, J. (1954). "Generalización del teorema de Glivenko-Cantelli" . Anales de estadística matemática . 25 (1): 131-138. doi : 10.1214 / aoms / 1177728852 . JSTOR 2236518 .

[1] Vapnik, V .; Chervonenkis, A (1968). "Convergencia uniforme de frecuencias de ocurrencia de eventos a sus probabilidades". Dokl. Akad. Nauk SSSR . 181 .

[1]