En la teoría de la probabilidad , el teorema de detención opcional (o el teorema de muestreo opcional de Doob ) dice que, bajo ciertas condiciones, el valor esperado de una martingala en un momento de detención es igual a su valor esperado inicial. Dado que las martingalas se pueden usar para modelar la riqueza de un jugador que participa en un juego limpio, el teorema de detención opcional dice que, en promedio, no se puede ganar nada al detener el juego basándose en la información obtenida hasta ahora (es decir, sin mirar hacia el futuro). ). Ciertas condiciones son necesarias para que este resultado sea cierto. En particular, el teorema se aplica a las estrategias de duplicación .
El teorema de parada opcional es una herramienta importante de las finanzas matemáticas en el contexto del teorema fundamental del precio de los activos .
Declaración
A continuación se ofrece una versión en tiempo discreto del teorema:
Sea X = ( X t ) t ∈ℕ 0 una martingala de tiempo discreto y τ un tiempo de parada con valores en ℕ 0 ∪ {∞ }, ambos con respecto a una filtración ( F t ) t ∈ℕ 0 . Suponga que se cumple una de las siguientes tres condiciones:
- ( a ) El tiempo de parada τ es casi seguro acotado, es decir, existe una constante c ∈ ℕ tal que τ ≤ c como
- ( b ) El tiempo de parada τ tiene una expectativa finita y las expectativas condicionales del valor absoluto de los incrementos de martingala están casi seguramente acotadas, más precisamente, y existe una constante c tal que casi con seguridad en el evento { τ > t } para todo t ∈ ℕ 0 .
- ( c ) Existe una constante c tal que | X t ∧ τ | ≤ c como para todo t ∈ ℕ 0 donde ∧ denota el operador mínimo .
Entonces X τ es una variable aleatoria casi seguramente bien definida y
De manera similar, si el proceso estocástico X = ( X t ) t ∈ℕ 0 es una submartingala o una supermartingala y se cumple una de las condiciones anteriores, entonces
para una submartingala, y
para una supermartingala.
Observación
Bajo la condición ( c ) es posible que τ = ∞ suceda con probabilidad positiva. En este evento, X τ se define como el límite puntual existente casi con seguridad de ( X t ) t ∈ℕ 0 ; consulte la demostración a continuación para obtener más detalles.
Aplicaciones
- El teorema de parada opcional puede usarse para demostrar la imposibilidad de estrategias de apuestas exitosas para un jugador con una vida útil finita (que da la condición ( a )) o un límite de la casa en las apuestas (condición ( b )). Supongamos que el jugador puede apostar hasta c dólares en un lanzamiento de moneda justo en los momentos 1, 2, 3, etc., ganando su apuesta si la moneda sale cara y perdiéndola si sale cruz. Suponga además que puede dejar de fumar cuando quiera, pero no puede predecir el resultado de apuestas que aún no han sucedido. Entonces, la fortuna del jugador a lo largo del tiempo es una martingala, y el momento τ en el que decide dejar de jugar (o se arruina y se ve obligado a hacerlo) es un tiempo de parada. Entonces, el teorema dice que E [ X τ ] = E [ X 0 ] . En otras palabras, el jugador se va con la misma cantidad de dinero en promedio que cuando empezó. (El mismo resultado es válido si el jugador, en lugar de tener un límite de la casa en las apuestas individuales, tiene un límite finito en su línea de crédito o en el grado de endeudamiento que puede llegar a tener, aunque esto es más fácil de demostrar con otra versión del teorema. )
- Supongamos que un paseo aleatorio a partir de un ≥ 0 que sube o baja por uno con igual probabilidad en cada paso. Supongamos, además, que el paseo se detiene si llega a 0 o m ≥ una ; el momento en que esto ocurre por primera vez es un momento de parada. Si se sabe que el tiempo esperado en el que termina la caminata es finito (digamos, de la teoría de la cadena de Markov ), el teorema de parada opcional predice que la posición de parada esperada es igual a la posición inicial a . Resolviendo a = pm + (1 - p ) 0 para la probabilidad p de que la caminata alcance m antes de 0 da p = a / m .
- Consideremos ahora un paseo aleatorio X que se inicia en 0 y se detiene si se alcanza - m o + m , y el uso de la Y n = X n 2 - n martingala de la sección de ejemplos . Si τ es el momento en el que X alcanza por primera vez ± m , entonces 0 = E [ Y 0 ] = E [ Y τ ] = m 2 - E [τ] . Esto da E [ τ ] = m 2 .
- Sin embargo, se debe tener cuidado para asegurar que se cumpla una de las condiciones del teorema. Por ejemplo, suponga que el último ejemplo hubiera utilizado un tiempo de parada 'unilateral', de modo que la parada solo se produjo en + m , no en - m . Por tanto, el valor de X en este tiempo de parada sería m . Por lo tanto, el valor esperado E [ X τ ] también debe ser m , aparentemente en violación del teorema que daría E [ X τ ] = 0 . El fracaso del teorema de parada opcional muestra que las tres condiciones fallan.
Prueba
Sea X τ el proceso detenido , también es una martingala (o una submartingala o supermartingala, respectivamente). Bajo la condición ( a ) o ( b ), la variable aleatoria X τ está bien definida. Bajo la condición ( c ) el proceso detenido X τ está acotado, por lo tanto, según el teorema de convergencia de martingala de Doob, converge puntualmente a una variable aleatoria que llamamos X τ .
Si se cumple la condición ( c ), entonces el proceso detenido X τ está limitado por la variable aleatoria constante M : = c . De lo contrario, escribir el proceso detenido como
da | X t τ | ≤ M para todo t ∈ ℕ 0 , donde
- .
Por el teorema de la convergencia monótona
- .
Si se cumple la condición ( a ), entonces esta serie solo tiene un número finito de términos distintos de cero, por lo que M es integrable.
Si la condición ( b ) se cumple, entonces continuamos insertando una expectativa condicional y usando que el evento { τ > s } se conoce en el tiempo s (tenga en cuenta que se supone que τ es un tiempo de parada con respecto a la filtración), por lo tanto
donde se utiliza una representación del valor esperado de variables aleatorias con valores enteros no negativos para la última igualdad.
Por lo tanto, en cualquiera de las tres condiciones en el teorema, se detuvo el proceso está dominado por una variable aleatoria integrable M . Dado que el proceso detenido X τ converge casi con seguridad a X τ , el teorema de convergencia dominado implica
Por la propiedad martingala del proceso detenido,
por eso
De manera similar, si X es una submartingala o supermartingala, respectivamente, cambie la igualdad en las dos últimas fórmulas a la desigualdad apropiada.
Referencias
- Grimmett, Geoffrey R .; Stirzaker, David R. (2001). Probabilidad y procesos aleatorios (3ª ed.). Prensa de la Universidad de Oxford. págs. 491 –495. ISBN 9780198572220.
- Bhattacharya, Rabi; Waymire, Edward C. (2007). Un curso básico de teoría de la probabilidad . Saltador. págs. 43–45. ISBN 978-0-387-71939-9.