El equilibrio secuencial es un refinamiento del equilibrio de Nash para juegos de forma extensiva debido a David M. Kreps y Robert Wilson . Un equilibrio secuencial especifica no solo una estrategia para cada uno de los jugadores, sino también una creencia para cada uno de los jugadores. Una creencia da, para cada conjunto de información del juego que pertenece al jugador, una distribución de probabilidad en los nodos del conjunto de información . Un perfil de estrategias y creencias se denomina evaluación del juego. Hablando informalmente, una evaluación es un perfecto equilibrio bayesiano si sus estrategias son sensatas dadas sus creencias ysus creencias se confirman en el camino del resultado dado por sus estrategias. La definición de equilibrio secuencial requiere además que haya perturbaciones arbitrariamente pequeñas de creencias y estrategias asociadas con la misma propiedad. Una implementación concreta de este concepto teórico se llama aprendizaje por refuerzo, donde un alumno recibe recompensas en función de sus acciones y, por lo tanto, está capacitado para adoptar una determinada estrategia óptima. Este concepto no es nuevo, pero debido a muchos problemas abiertos sigue siendo un tema de investigación candente.
Equilibrio secuencial | |
---|---|
Un concepto de solución en la teoría de juegos | |
Relación | |
Subconjunto de | Equilibrio perfecto en subjuegos , equilibrio bayesiano perfecto |
Superconjunto de | mano temblorosa de forma extensiva equilibrio perfecto , equilibrio cuasi-perfecto |
Significado | |
Propuesto por | David M. Kreps y Robert Wilson |
Usado para | Juegos de formas extensas |
Evaluaciones consistentes
La definición formal de que una estrategia es sensata dada una creencia es sencilla; la estrategia debería simplemente maximizar la rentabilidad esperada en cada conjunto de información. También es sencillo definir lo que debería ser una creencia sensata para aquellos conjuntos de información que se alcanzan con probabilidad positiva dadas las estrategias; las creencias deben ser la distribución de probabilidad condicional en los nodos del conjunto de información, dado que se alcanza. Esto implica la aplicación de la regla de Bayes.
Está lejos de ser sencillo definir lo que debería ser una creencia sensata para aquellos conjuntos de información que se alcanzan con probabilidad cero, dadas las estrategias. De hecho, esta es la principal contribución conceptual de Kreps y Wilson. Su requisito de coherencia es el siguiente: La evaluación debe ser un punto límite de una secuencia de perfiles estratégicos totalmente mezclados y creencias sensibles asociadas, en el sentido sencillo anterior.
Relación con otros refinamientos de equilibrio
El equilibrio secuencial es un refinamiento adicional del equilibrio perfecto en subjuegos e incluso del equilibrio bayesiano perfecto . Se refina en sí mismo mediante el equilibrio perfecto y el equilibrio adecuado de la mano temblorosa de forma extensiva . Las estrategias de equilibrios secuenciales (o incluso equilibrios perfectos de manos temblorosas de forma extensiva ) no son necesariamente admisibles . Un refinamiento del equilibrio secuencial que garantiza la admisibilidad es el equilibrio cuasi-perfecto .
Referencias
David M. Kreps y Robert Wilson . "Sequential Equilibria", Econometrica 50: 863-894, 1982.