En la teoría de la probabilidad , una medida empírica es una medida aleatoria que surge de una realización particular de una secuencia (generalmente finita) de variables aleatorias . La definición precisa se encuentra a continuación. Las medidas empíricas son relevantes para la estadística matemática .
La motivación para estudiar medidas empíricas es que a menudo es imposible conocer la verdadera medida de probabilidad subyacente. . Recopilamos observacionesy calcular frecuencias relativas . Podemos estimar, o una función de distribución relacionada mediante la medida empírica o la función de distribución empírica, respectivamente. Se trata de estimaciones uniformemente buenas en determinadas condiciones. Los teoremas en el área de procesos empíricos proporcionan tasas de esta convergencia.
Definición
Dejar ser una secuencia de independientes idénticamente distribuidas variables aleatorias con valores en el espacio de estados S con distribución de probabilidad P .
Definición
- La medida empírica P n se define para subconjuntos medibles de S y está dada por
- dónde es la función del indicador y es la medida de Dirac .
Propiedades
- Para un conjunto medible fijo A , nP n ( A ) es una variable aleatoria binomial con media nP ( A ) y varianza nP ( A ) (1 - P ( A )).
- En particular, P n ( A ) es un estimador insesgado de P ( A ).
- Para una partición fija de S , variables aleatoriasformar una distribución multinomial con probabilidades de eventos
- La matriz de covarianza de esta distribución multinomial es.
Definición
- es la medida empírica indexada por , Una colección de subconjuntos medibles de S .
Para generalizar más esta noción, observe que la medida empírica mapas de funciones medibles a su medio empírico ,
En particular, la medida empírica de A es simplemente la media empírica de la función indicadora, P n ( A ) = P n I A .
Para una función medible fija , es una variable aleatoria con media y varianza .
Por la fuerte ley de los grandes números , P n ( A ) converge a P ( A ) casi con seguridad para A fijo . similar converge a casi seguramente para una función fija y medible . El problema de la convergencia uniforme de P n a P estaba abierto hasta que Vapnik y Chervonenkis lo resolvieron en 1968. [1]
Si la clase (o ) es Glivenko-Cantelli con respecto a P, entonces P n converge a P uniformemente sobre (o ). En otras palabras, con probabilidad 1 tenemos
Función de distribución empírica
La función de distribución empírica proporciona un ejemplo de medidas empíricas. Para variables aleatorias iid de valor real es dado por
En este caso, las medidas empíricas están indexadas por una clase Se ha demostrado que es una clase uniforme de Glivenko-Cantelli , en particular,
con probabilidad 1.
Ver también
Referencias
- ^ Vapnik, V .; Chervonenkis, A (1968). "Convergencia uniforme de frecuencias de ocurrencia de eventos a sus probabilidades". Dokl. Akad. Nauk SSSR . 181 .
Otras lecturas
- Billingsley, P. (1995). Probabilidad y medida (tercera ed.). Nueva York: John Wiley and Sons. ISBN 0-471-80478-9.
- Donsker, MD (1952). "Justificación y extensión del enfoque heurístico de Doob a los teoremas de Kolmogorov-Smirnov" . Anales de estadística matemática . 23 (2): 277–281. doi : 10.1214 / aoms / 1177729445 .
- Dudley, RM (1978). "Teoremas del límite central para medidas empíricas" . Anales de probabilidad . 6 (6): 899–929. doi : 10.1214 / aop / 1176995384 . JSTOR 2243028 .
- Dudley, RM (1999). Teoremas uniformes del límite central . Estudios de Cambridge en Matemáticas Avanzadas. 63 . Cambridge, Reino Unido: Cambridge University Press. ISBN 0-521-46102-2.
- Wolfowitz, J. (1954). "Generalización del teorema de Glivenko-Cantelli" . Anales de estadística matemática . 25 (1): 131-138. doi : 10.1214 / aoms / 1177728852 . JSTOR 2236518 .