Juego sin valor

En la teoría matemática de los juegos , en particular el estudio de los juegos continuos de suma cero , no todos los juegos tienen un valor minimax . Este es el valor esperado para uno de los jugadores cuando ambos juegan una estrategia perfecta (que es elegir de un PDF en particular ).

Cuadrado de juego (es decir, la recompensa para el jugador I) por un juego sin valor, debido a Sion y Wolfe. La recompensa es 0 a lo largo de las dos líneas diagonales.

Este artículo da un ejemplo de un juego de suma cero que no tiene valor . Se debe a Sion y Wolfe . ^[1]

Se sabe que los juegos de suma cero con un número finito de estrategias puras tienen un valor minimax (probado originalmente por John von Neumann ), pero este no es necesariamente el caso si el juego tiene un conjunto infinito de estrategias. A continuación, se muestra un ejemplo sencillo de un juego sin valor minimax.

La existencia de tales juegos de suma cero es interesante porque muchos de los resultados de la teoría de juegos se vuelven inaplicables si no hay un valor minimax.

El juego

Los jugadores I y II eligen cada uno un número, ${\ Displaystyle x}$ y ${\ Displaystyle y}$ respectivamente, con ${\ Displaystyle x, y \ in [0,1]}$ ; la recompensa para mí es

{\ displaystyle K (x, y) = {\ begin {cases} -1 & {\ text {if}} x

(es decir, el jugador II paga ${\ Displaystyle K (x, y)}$ al jugador I; el juego es de suma cero ). A veces se hace referencia al jugador I como el jugador maximizador y al jugador II como el jugador minimizador .

Si ${\ Displaystyle (x, y)}$ se interpreta como un punto en el cuadrado unitario, la figura muestra la recompensa para el jugador I. Ahora suponga que el jugador I adopta una estrategia mixta: elegir un número de la función de densidad de probabilidad (pdf) ${\ Displaystyle f}$ ; jugador II elige entre ${\ Displaystyle g}$ . El jugador I busca maximizar la recompensa, el jugador II, minimizar la recompensa. Tenga en cuenta que cada jugador es consciente del objetivo del otro.

Valor del juego

Sion y Wolfe demuestran que

{\ Displaystyle \ sup _ {f} \ inf _ {g} \ iint K \, df \, dg = {\ frac {1} {3}}}

pero

{\ Displaystyle \ inf _ {g} \ sup _ {f} \ iint K \, df \, dg = {\ frac {3} {7}}.}

Estas son las expectativas máximas y mínimas del valor del juego del jugador I y II, respectivamente.

La ${\ Displaystyle \ sup}$ y ${\ Displaystyle \ inf}$ respectivamente, tome el supremum y el infimum sobre los PDF en el intervalo unitario (en realidad, medidas de probabilidad de Borel ). Estos representan las estrategias (mixtas) del jugador I y del jugador II. Por lo tanto, el jugador I puede asegurarse una recompensa de al menos 3/7 si conoce la estrategia del jugador II; y el jugador II puede mantener la recompensa en 1/3 si conoce la estrategia del jugador I.

Claramente no hay equilibrio épsilon para lo suficientemente pequeño ${\ Displaystyle \ varepsilon}$ , específicamente, si ${\ Displaystyle \ varepsilon <{\ frac {1} {2}} \ left ({\ frac {3} {7}} - {\ frac {1} {3}} \ right) \ simeq 0.0476}$ . Dasgupta y Maskin ^[2] afirman que los valores del juego se logran si el jugador I pone el peso de probabilidad solo en el set. ${\ Displaystyle \ left \ {0,1 / 2,1 \ right \}}$ y el jugador II pone peso solo en ${\ Displaystyle \ left \ {1 / 4,1 / 2,1 \ right \}}$ .

El teorema de Glicksberg muestra que cualquier juego de suma cero con función de pago semicontinua superior o inferior tiene un valor (en este contexto, una función semicontinua superior (inferior) K es aquella en la que el conjunto ${\ Displaystyle \ {P \ mid K (P)$ (resp ${\ Displaystyle \ {P \ mid K (P)> c \}}$ ) está abierto para cualquier c ) real .

Observe que la función de pago del ejemplo de Sion y Wolfe claramente no es semicontinua. Sin embargo, se puede lograr cambiando el valor de K ( x , x ) y K ( x , x + 1/2) [es decir, la recompensa a lo largo de las dos discontinuidades] a +1 o −1, haciendo que la recompensa sea superior o semicontinuo inferior respectivamente. Si se hace esto, el juego tiene un valor.

Generalizaciones

El trabajo posterior de Heuer ^[3] analiza una clase de juegos en los que el cuadrado unitario se divide en tres regiones, siendo la función de pago constante en cada una de las regiones.

Referencias

↑ Sion, Maurice; Wolfe, Phillip (1957), "Sobre un juego sin valor", en Dresher, M .; Tucker, AW; Wolfe, P. (eds.), Contribuciones a la teoría de los juegos III , Annals of Mathematics Studies 39, Princeton University Press, págs. 299-306, ISBN 9780691079363
^ P. Dasgupta y E. Maskin (1986). "La existencia de equilibrio en juegos económicos discontinuos, I: Teoría". Revisión de estudios económicos . 53 (1): 1–26. doi : 10.2307 / 2297588 . JSTOR 2297588 .
^ GA Heuer (2001). "Juegos de particiones de tres partes en rectángulos". Informática Teórica . 259 : 639–661. doi : 10.1016 / S0304-3975 (00) 00404-7 .

[1] Sion, Maurice; Wolfe, Phillip (1957), "Sobre un juego sin valor", en Dresher, M .; Tucker, AW; Wolfe, P. (eds.), Contribuciones a la teoría de los juegos III , Annals of Mathematics Studies 39, Princeton University Press, págs. 299-306, ISBN 9780691079363

[2] P. Dasgupta y E. Maskin (1986). "La existencia de equilibrio en juegos económicos discontinuos, I: Teoría". Revisión de estudios económicos . 53 (1): 1–26. doi : 10.2307 / 2297588 . JSTOR 2297588 .

[3] GA Heuer (2001). "Juegos de particiones de tres partes en rectángulos". Informática Teórica . 259 : 639–661. doi : 10.1016 / S0304-3975 (00) 00404-7 .

[1]