Doob martingala

Una martingala Doob (llamada así por Joseph L. Doob , ^[1] también conocida como martingala Levy ) es una construcción matemática de un proceso estocástico que se aproxima a una variable aleatoria dada y tiene la propiedad de martingala con respecto a la filtración dada . Puede considerarse como la secuencia evolutiva de las mejores aproximaciones a la variable aleatoria basada en la información acumulada hasta cierto tiempo.

Al analizar sumas, paseos aleatorios , u otras funciones aditivas de variables aleatorias independientes , a menudo se puede aplicar el teorema del límite central , la ley de los grandes números , la desigualdad de Chernoff , la desigualdad de Chebyshev o herramientas similares. Al analizar objetos similares donde las diferencias no son independientes, las principales herramientas son las martingalas y la desigualdad de Azuma . ^{[ aclaración necesaria ]}

Definición

Dejar ${\ Displaystyle Y}$ ser cualquier variable aleatoria con ${\ Displaystyle \ mathbb {E} [| Y |] <\ infty}$ . Suponer ${\ Displaystyle \ left \ {{\ mathcal {F}} _ {0}, {\ mathcal {F}} _ {1}, \ dots \ right \}}$ es una filtración , es decir ${\ Displaystyle {\ mathcal {F}} _ {s} \ subconjunto {\ mathcal {F}} _ {t}}$ Cuándo ${\ Displaystyle s }>$ . Definir

{\ Displaystyle Z_ {t} = \ mathbb {E} [Y \ mid {\ mathcal {F}} _ {t}],}

luego ${\ Displaystyle \ left \ {Z_ {0}, Z_ {1}, \ dots \ right \}}$ es una martingala , ^{[2] a} saber, Doob martingala , con respecto a la filtración ${\ Displaystyle \ left \ {{\ mathcal {F}} _ {0}, {\ mathcal {F}} _ {1}, \ dots \ right \}}$ .

Para ver esto, tenga en cuenta que

${\ Displaystyle \ mathbb {E} [| Z_ {t} |] = \ mathbb {E} [| \ mathbb {E} [Y \ mid {\ mathcal {F}} _ {t}] |] \ leq \ mathbb {E} [\ mathbb {E} [| Y | \ mid {\ mathcal {F}} _ {t}]] = \ mathbb {E} [| Y |] <\ infty}$ ;
${\ Displaystyle \ mathbb {E} [Z_ {t} \ mid {\ mathcal {F}} _ {t-1}] = \ mathbb {E} [\ mathbb {E} [Y \ mid {\ mathcal {F }} _ {t}] \ mid {\ mathcal {F}} _ {t-1}] = \ mathbb {E} [Y \ mid {\ mathcal {F}} _ {t-1}] = Z_ { t-1}}$ como ${\ Displaystyle {\ mathcal {F}} _ {t-1} \ subconjunto {\ mathcal {F}} _ {t}}$ .

En particular, para cualquier secuencia de variables aleatorias ${\ Displaystyle \ left \ {X_ {1}, X_ {2}, \ dots, X_ {n} \ right \}}$ en el espacio de probabilidad ${\ Displaystyle (\ Omega, {\ mathcal {F}}, {\ text {P}})}$ y función ${\ Displaystyle f}$ tal que ${\ Displaystyle \ mathbb {E} [| f (X_ {1}, X_ {2}, \ dots, X_ {n}) |] <\ infty}$ , uno podría elegir

{\ Displaystyle Y: = f (X_ {1}, X_ {2}, \ dots, X_ {n})}

y filtración ${\ Displaystyle \ left \ {{\ mathcal {F}} _ {0}, {\ mathcal {F}} _ {1}, \ dots \ right \}}$ tal que

{\ Displaystyle {\ begin {alineado} {\ mathcal {F}} _ {0} &: = \ left \ {\ phi, \ Omega \ right \}, \\ {\ mathcal {F}} _ {t} &: = \ sigma (X_ {1}, X_ {2}, \ dots, X_ {t}), \ forall t \ geq 1, \ end {alineado}}}

es decir ${\ Displaystyle \ sigma}$ -álgebra generada por ${\ Displaystyle X_ {1}, X_ {2}, \ dots, X_ {t}}$ . Entonces, por definición de Doob martingale, proceso ${\ Displaystyle \ left \ {Z_ {0}, Z_ {1}, \ dots \ right \}}$ dónde

{\ Displaystyle {\ begin {alineado} Z_ {0} &: = \ mathbb {E} [f (X_ {1}, X_ {2}, \ dots, X_ {n}) \ mid {\ mathcal {F} } _ {0}] = \ mathbb {E} [f (X_ {1}, X_ {2}, \ dots, X_ {n})], \\ Z_ {t} &: = \ mathbb {E} [ f (X_ {1}, X_ {2}, \ puntos, X_ {n}) \ mid {\ mathcal {F}} _ {t}] = \ mathbb {E} [f (X_ {1}, X_ { 2}, \ dots, X_ {n}) \ mid X_ {1}, X_ {2}, \ dots, X_ {t}], \ forall t \ geq 1 \ end {alineado}}}

forma una martingala Doob. Tenga en cuenta que ${\ Displaystyle Z_ {n} = f (X_ {1}, X_ {2}, \ dots, X_ {n})}$ . Esta martingala se puede utilizar para probar la desigualdad de McDiarmid .

La desigualdad de McDiarmid

Declaración ^[1]

Considere variables aleatorias independientes ${\ Displaystyle X_ {1}, X_ {2}, \ dots X_ {n}}$ en el espacio de probabilidad ${\ Displaystyle (\ Omega, {\ mathcal {F}}, {\ text {P}})}$ dónde ${\ Displaystyle X_ {i} \ in {\ mathcal {X}} _ {i}}$ para todos ${\ Displaystyle i}$ y un mapeo ${\ Displaystyle f: {\ mathcal {X}} _ {1} \ times {\ mathcal {X}} _ {2} \ times \ cdots \ times {\ mathcal {X}} _ {n} \ rightarrow \ mathbb {R}}$ . Suponga que existen constantes ${\ Displaystyle c_ {1}, c_ {2}, \ dots, c_ {n}}$ tal que para todos ${\ Displaystyle i}$ ,

{\ Displaystyle {\ underset {x_ {1}, \ cdots, x_ {i-1}, x_ {i}, x_ {i} ', x_ {i + 1}, \ cdots, x_ {n}} {\ " sup}} | f (x_ {1}, \ puntos, x_ {i-1}, x_ {i}, x_ {i + 1}, \ cdots, x_ {n}) - f (x_ {1}, \ puntos, x_ {i-1}, x_ {i} ', x_ {i + 1}, \ cdots, x_ {n}) | \ leq c_ {i}.}

(En otras palabras, cambiar el valor de la ${\ Displaystyle i}$ th coordenada ${\ Displaystyle x_ {i}}$ cambia el valor de ${\ Displaystyle f}$ por como máximo ${\ Displaystyle c_ {i}}$ .) Entonces, para cualquier ${\ Displaystyle \ epsilon> 0}$ ,

{\ Displaystyle {\ text {P}} (f (X_ {1}, X_ {2}, \ cdots, X_ {n}) - \ mathbb {E} [f (X_ {1}, X_ {2}, \ cdots, X_ {n})] \ geq \ epsilon) \ leq \ exp \ left (- {\ frac {2 \ epsilon ^ {2}} {\ sum _ {i = 1} ^ {n} c_ {i } ^ {2}}} \ derecha),}

{\ Displaystyle {\ text {P}} (f (X_ {1}, X_ {2}, \ cdots, X_ {n}) - \ mathbb {E} [f (X_ {1}, X_ {2}, \ cdots, X_ {n})] \ leq - \ epsilon) \ leq \ exp \ left (- {\ frac {2 \ epsilon ^ {2}} {\ sum _ {i = 1} ^ {n} c_ { i} ^ {2}}} \ right),}

y

{\ Displaystyle {\ text {P}} (| f (X_ {1}, X_ {2}, \ cdots, X_ {n}) - \ mathbb {E} [f (X_ {1}, X_ {2} , \ cdots, X_ {n})] | \ geq \ epsilon) \ leq 2 \ exp \ left (- {\ frac {2 \ epsilon ^ {2}} {\ sum _ {i = 1} ^ {n} c_ {i} ^ {2}}} \ right).}

Prueba

Elija cualquiera ${\ Displaystyle x_ {1} ', x_ {2}', \ cdots, x_ {n} '}$ tal que el valor de ${\ Displaystyle f (x_ {1} ', x_ {2}', \ cdots, x_ {n} ')}$ está acotado, entonces, para cualquier ${\ Displaystyle x_ {1}, x_ {2}, \ cdots, x_ {n}}$ , por desigualdad triangular ,

{\ Displaystyle {\ begin {alineado} & | f (x_ {1}, x_ {2}, \ cdots, x_ {n}) - f (x_ {1} ', x_ {2}', \ cdots, x_ {n} ') | \\\ leq & | f (x_ {1}, x_ {2}, \ cdots, x_ {n}) - f (x_ {1}', x_ {2}, \ cdots, x_ {n}) | \\ & + \ sum _ {i = 1} ^ {n-1} | f (x_ {1} ', \ cdots, x_ {i}', x_ {i + 1}, \ cdots , x_ {n}) - f (x_ {1} ', x_ {2}', \ cdots, x_ {i} ', x_ {i + 1}', x_ {i + 2}, \ cdots, x_ { n}) | \\\ leq & \ sum _ {i = 1} ^ {n} c_ {i}, \ end {alineado}}}

por lo tanto ${\ Displaystyle f}$ está ligado.

Definir ${\ Displaystyle Z_ {i}: = \ mathbb {E} [f (X_ {1}, X_ {2}, \ cdots, X_ {n}) \ mid X_ {1}, X_ {2}, \ cdots, X_ {i}]}$ para todos ${\ Displaystyle i \ geq 1}$ y ${\ Displaystyle Z_ {0}: = \ mathbb {E} [f (X_ {1}, X_ {2}, \ cdots, X_ {n})]}$ . Tenga en cuenta que ${\ Displaystyle Z_ {n} = f (X_ {1}, X_ {2}, \ cdots, X_ {n})}$ . Desde ${\ Displaystyle f}$ está limitado, por la definición de Doob martingala, ${\ Displaystyle \ left \ {Z_ {i} \ right \}}$ forma una martingala. Ahora define ${\ Displaystyle {\ begin {alineado} U_ {i} & = {\ underset {x \ in {\ mathcal {X}} _ {i}} {\ sup}} \ mathbb {E} [f (X_ {1 }, \ cdots, X_ {n}) \ mid X_ {1}, \ cdots, X_ {i-1}, x] - \ mathbb {E} [f (X_ {1}, \ cdots, X_ {n} ) \ mid X_ {1}, \ cdots, X_ {i-1}], \\ L_ {i} & = {\ underset {x \ in {\ mathcal {X}} _ {i}} {\ inf} } \ mathbb {E} [f (X_ {1}, \ cdots, X_ {n}) \ mid X_ {1}, \ cdots, X_ {i-1}, x] - \ mathbb {E} [f ( X_ {1}, \ cdots, X_ {n}) \ mid X_ {1}, \ cdots, X_ {i-1}]. \ End {alineado}}}$

Tenga en cuenta que ${\ Displaystyle L_ {i} \ leq Z_ {i} -Z_ {i-1} \ leq U_ {i}}$ y ${\ Displaystyle U_ {i}, L_ {i}}$ son ambos ${\ Displaystyle {\ mathcal {F}} _ {i-1}}$ - medible . Además,

{\ Displaystyle {\ begin {alineado} U_ {i} -L_ {i} & = {\ underset {x_ {u} \ in {\ mathcal {X}} _ {i}, x_ {l} \ in {\ mathcal {X}} _ {i}} {\ sup}} \ mathbb {E} [f (X_ {1}, \ cdots, X_ {n}) \ mid X_ {1}, \ cdots, X_ {i- 1}, x_ {u}] - \ mathbb {E} [f (X_ {1}, \ cdots, X_ {n}) \ mid X_ {1}, \ cdots, X_ {i-1}, x_ {l }] \\ & = {\ underset {x_ {u} \ in {\ mathcal {X}} _ {i}, x_ {l} \ in {\ mathcal {X}} _ {i}} {\ sup} } \ int _ {{\ mathcal {X}} _ {i + 1} \ times \ cdots \ times {\ mathcal {X}} _ {n}} f (X_ {1}, \ cdots, X_ {i- 1}, x_ {u}, x_ {i + 1}, \ cdots, x_ {n}) {\ text {d}} {\ text {P}} _ {X_ {i + 1}, \ cdots, X_ {n} \ mid X_ {1}, \ cdots, X_ {t-1}, x_ {u}} (x_ {i + 1}, \ cdots, x_ {n}) \\ & \ quad - \ int _ {{\ mathcal {X}} _ {i + 1} \ times \ cdots \ times {\ mathcal {X}} _ {n}} f (X_ {1}, \ cdots, X_ {i-1}, x_ {l}, x_ {i + 1}, \ cdots, x_ {n}) {\ text {d}} {\ text {P}} _ {X_ {i + 1}, \ cdots, X_ {n} \ mediados de X_ {1}, \ cdots, X_ {t-1}, x_ {l}} (x_ {i + 1}, \ cdots, x_ {n}) \\ & = {\ underset {x_ {u} \ en {\ mathcal {X}} _ {i}, x_ {l} \ in {\ mathcal {X}} _ {i}} {\ sup}} \ int _ {{\ mathcal {X}} _ {i +1} \ times \ cdots \ times {\ mathcal {X}} _ {n}} f (X_ {1}, \ cdots, X_ {i-1}, x_ {u}, x_ {i + 1}, \ cdots, x_ {n}) {\ text {d}} {\ text {P }} _ {X_ {i + 1}, \ cdots, X_ {n}} (x_ {i + 1}, \ cdots, x_ {n}) \\ & \ quad - \ int _ {{\ mathcal {X }} _ {i + 1} \ veces \ cdots \ veces {\ mathcal {X}} _ {n}} f (X_ {1}, \ cdots, X_ {i-1}, x_ {l}, x_ { i + 1}, \ cdots, x_ {n}) {\ text {d}} {\ text {P}} _ {X_ {i + 1}, \ cdots, X_ {n}} (x_ {i + 1 }, \ cdots, x_ {n}) \\ & = {\ underset {x_ {u} \ in {\ mathcal {X}} _ {i}, x_ {l} \ in {\ mathcal {X}} _ {i}} {\ sup}} \ int _ {{\ mathcal {X}} _ {i + 1} \ times \ cdots \ times {\ mathcal {X}} _ {n}} f (X_ {1} , \ cdots, X_ {i-1}, x_ {u}, x_ {i + 1}, \ cdots, x_ {n}) \\ & \ quad -f (X_ {1}, \ cdots, X_ {i -1}, x_ {l}, x_ {i + 1}, \ cdots, x_ {n}) \ {\ text {d}} {\ text {P}} _ {X_ {i + 1}, \ cdots , X_ {n}} (x_ {i + 1}, \ cdots, x_ {n}) \\ & \ leq {\ underset {x_ {u} \ in {\ mathcal {X}} _ {i}, x_ {l} \ in {\ mathcal {X}} _ {i}} {\ sup}} \ int _ {{\ mathcal {X}} _ {i + 1} \ times \ cdots \ times {\ mathcal {X }} _ {n}} c_ {i} \ {\ text {d}} {\ text {P}} _ {X_ {i + 1}, \ cdots, X_ {n}} (x_ {i + 1} , \ cdots, x_ {n}) \\ & \ leq c_ {i} \ end {alineado}}}

donde la tercera igualdad se mantiene debido a la independencia de ${\ Displaystyle X_ {1}, X_ {2}, \ cdots, X_ {n}}$ . Luego, aplicando la forma general de la desigualdad de Azuma a ${\ Displaystyle \ left \ {Z_ {i} \ right \}}$ , tenemos

{\ Displaystyle {\ text {P}} (f (X_ {1}, \ cdots, X_ {n}) - \ mathbb {E} [f (X_ {1}, \ cdots, X_ {n})] \ geq \ epsilon) = {\ text {P}} (Z_ {n} -Z_ {0} \ geq \ epsilon) \ leq \ exp \ left (- {\ frac {2 \ epsilon ^ {2}} {\ sum _ {i = 1} ^ {n} c_ {i} ^ {2}}} \ derecha).}

La cota unilateral de la otra dirección se obtiene aplicando la desigualdad de Azuma a ${\ Displaystyle \ left \ {- Z_ {i} \ right \}}$ y el límite de dos caras se sigue del límite de unión . ${\ Displaystyle \ cuadrado}$

Ver también

Desigualdad de concentración : un resumen de McDiarmid's y varias desigualdades similares.

Referencias

↑ ^a ^b Doob, JL (1940). "Propiedades de regularidad de determinadas familias de variables de azar" (PDF) . Transacciones de la American Mathematical Society . 47 (3): 455–486. doi : 10.2307 / 1989964 . JSTOR 1989964 .
^ Doob, JL (1953). Procesos estocásticos . 101 . Nueva York: Wiley. pag. 293.

[Doob-1] Doob, JL (1940). "Propiedades de regularidad de determinadas familias de variables de azar" (PDF) . Transacciones de la American Mathematical Society . 47 (3): 455–486. doi : 10.2307 / 1989964 . JSTOR 1989964 .

[2] Doob, JL (1953). Procesos estocásticos . 101 . Nueva York: Wiley. pag. 293.

[1]