Teorema de purificación

En teoría de juegos , el teorema de la purificación fue aportado por el premio Nobel John Harsanyi en 1973. ^[1] El teorema tiene como objetivo justificar un aspecto desconcertante de los equilibrios de Nash de estrategias mixtas : que cada jugador es totalmente indiferente entre cada una de las acciones que pone distintas de cero. de peso, sin embargo, los mezcla para hacer que todos los demás jugadores también sean indiferentes.

Los equilibrios de estrategia mixta se explican como el límite de los equilibrios de estrategia pura para un juego perturbado de información incompleta en el que los pagos de cada jugador son conocidos por ellos mismos pero no por sus oponentes. La idea es que la estrategia mixta predicha del juego original surja como aproximaciones cada vez mejores de un juego que no es observado por el teórico que diseñó el juego idealizado original.

La naturaleza aparentemente mixta de la estrategia es en realidad solo el resultado de que cada jugador juegue una estrategia pura con valores de umbral que dependen de la distribución ex ante sobre el continuo de pagos que un jugador puede tener. A medida que ese continuo se reduce a cero, las estrategias de los jugadores convergen hacia los equilibrios de Nash predichos del juego de información original, imperturbable y completo .

El resultado es también un aspecto importante de las investigaciones modernas en la teoría de juegos evolutivos donde los valores perturbados se interpretan como distribuciones sobre tipos de jugadores emparejados aleatoriamente en una población para jugar.

Ejemplo

	C	D
C	3, 3	2, 4
D	4, 2	0, 0
Fig.1: juego de halcón y paloma

Considere el juego Hawk-Dove que se muestra aquí. El juego tiene dos equilibrios de estrategia pura (Defecto, Cooperar) y (Cooperar, Defecto). También tiene un equilibrio mixto en el que cada jugador juega Cooperar con probabilidad 2/3.

Suponga que cada jugador i tiene un costo extra a _i por jugar Cooperar, que se distribuye uniformemente en [- A , A ]. Los jugadores solo conocen su propio valor de este costo. Entonces, este es un juego de información incompleta que podemos resolver usando el equilibrio bayesiano de Nash . La probabilidad de que un _i ≤ a * es ( a * + A ) / 2 A . Si el jugador 2 Coopera cuando un ₂ ≤ a * , entonces el jugador 1 de utilidad esperada de cooperar es - un ₁ + 3 ( a * + A ) / 2 A + 2 (1 - ( a * + A ) / 2 A ) ; su utilidad esperada de desertar es 4 ( a * + A ) / 2 A . Se debe, por tanto, el propio cooperar cuando un ₁ ≤ 2 - 3 ( a * + A ) / 2 A . Buscando un equilibrio simétrico donde ambos jugadores cooperan si a _i ≤ a * , resolvemos esto para a * = 1 / (2 + 3 / A ). Ahora que hemos calculado un * , podemos calcular la probabilidad de que cada jugador juegue Cooperar como

{\ Displaystyle \ Pr (a_ {i} \ leq a ^ {*}) = {\ frac {{\ frac {1} {2 + 3 / A}} + A} {2A}} = {\ frac {A } {4A ^ {2} + 6A}} + {\ frac {1} {2}}.}

Cuando A → 0, esto se acerca a 2/3, la misma probabilidad que en la estrategia mixta en el juego de información completo.

Por lo tanto, podemos pensar en el equilibrio de estrategias mixtas como el resultado de estrategias puras seguidas por jugadores que tienen una pequeña cantidad de información privada sobre sus pagos.

Detalles técnicos

La prueba de Harsanyi implica la fuerte suposición de que las perturbaciones de cada jugador son independientes de las de los demás. Sin embargo, se han intentado nuevos refinamientos para hacer el teorema más general. ^[2]^[3]

El resultado principal del teorema es que todos los equilibrios de estrategias mixtas de un juego dado pueden purificarse utilizando la misma secuencia de juegos perturbados. Sin embargo, además de la independencia de las perturbaciones, se basa en que el conjunto de recompensas para esta secuencia de juegos sea de plena medida. Hay juegos, de carácter patológico, para los que esta condición no se cumple.

El principal problema con estos juegos se divide en una de dos categorías: (1) varias estrategias mixtas del juego son purificadas por diferentes secuencias de juegos perturbados y (2) algunas estrategias mixtas del juego involucran estrategias débilmente dominadas. Ninguna estrategia mixta que involucre una estrategia débilmente dominada se puede purificar usando este método porque si alguna vez existe alguna probabilidad no negativa de que el oponente juegue una estrategia para la cual la estrategia débilmente dominada no es la mejor respuesta, entonces uno nunca deseará jugar. la estrategia débilmente dominada. Por tanto, el límite no se cumple porque implica una discontinuidad. ^[4]

Referencias

^ JC Harsanyi. 1973. "Juegos con pagos perturbados aleatoriamente: un nuevo fundamento para los puntos de equilibrio de estrategia mixta. Int. J. Game Theory 2 (1973), págs. 1-23. Doi : 10.1007 / BF01737554
^ R. Aumann, et al. 1983. "Purificación aproximada de estrategias mixtas. Matemáticas de la investigación operativa 8 (1983), págs. 327–341".
^ Govindan, S., Reny, PJ y Robson, AJ 2003. "Una prueba breve del teorema de purificación de Harsanyi. Juegos y comportamiento económico 45 (2) (2003), págs. 369-374. Doi : 10.1016 / S0899-8256 ( 03) 00149-0
^ Fudenberg, Drew y Jean Tirole: Teoría de juegos , MIT Press, 1991, págs. 233-234

[1] JC Harsanyi. 1973. "Juegos con pagos perturbados aleatoriamente: un nuevo fundamento para los puntos de equilibrio de estrategia mixta. Int. J. Game Theory 2 (1973), págs. 1-23. Doi : 10.1007 / BF01737554

[2] R. Aumann, et al. 1983. "Purificación aproximada de estrategias mixtas. Matemáticas de la investigación operativa 8 (1983), págs. 327–341".

[3] Govindan, S., Reny, PJ y Robson, AJ 2003. "Una prueba breve del teorema de purificación de Harsanyi. Juegos y comportamiento económico 45 (2) (2003), págs. 369-374. Doi : 10.1016 / S0899-8256 ( 03) 00149-0

[4] Fudenberg, Drew y Jean Tirole: Teoría de juegos , MIT Press, 1991, págs. 233-234

[1]