Parada óptima


En matemáticas , la teoría de la detención óptima [1] [2] o de la detención temprana [3] se ocupa del problema de elegir un momento para realizar una acción en particular, con el fin de maximizar una recompensa esperada o minimizar un costo esperado. Los problemas de detención óptimos se pueden encontrar en áreas de estadística , economía y finanzas matemáticas (relacionadas con el precio de las opciones estadounidenses ). Un ejemplo clave de un problema de parada óptimo es el problema de la secretaria . Los problemas de parada óptima a menudo se pueden escribir en forma de una ecuación de Bellmany, por lo tanto, a menudo se resuelven mediante programación dinámica .

Considere un proceso de ganancia definido en un espacio de probabilidad filtrado y suponga que está adaptado a la filtración. El problema de parada óptimo es encontrar el tiempo de parada que maximiza la ganancia esperada

donde se llama función de valor . Aquí puede tomar valor .

Una formulación más específica es la siguiente. Consideramos un proceso de Markov fuerte adaptado definido en un espacio de probabilidad filtrado donde denota la medida de probabilidad donde el proceso estocástico comienza en . Dadas las funciones continuas , y , el problema de parada óptimo es

Esto a veces se denomina formulación MLS (que significan Mayer, Lagrange y supremum, respectivamente). [4]