Dominio del riesgo

El dominio del riesgo y el dominio del pago son dos refinamientos relacionados del concepto de solución de equilibrio de Nash (NE) en la teoría de juegos , definido por John Harsanyi y Reinhard Selten . Un equilibrio de Nash se considera dominante en el pago si es Pareto superior a todos los demás equilibrios de Nash del juego. ¹ Al enfrentarse a una elección entre equilibrios, todos los jugadores estarían de acuerdo en el equilibrio dominante de pago, ya que ofrece a cada jugador al menos tanto beneficio como los demás equilibrios de Nash. Por el contrario, un equilibrio de Nash se considera de riesgo dominante si tiene el mayor cuenca de atracción (es decir, es menos riesgosa). Esto implica que cuanta más incertidumbre tengan los jugadores sobre las acciones de los otros jugadores, es más probable que elijan la estrategia que les corresponde.

Dominio del riesgo Dominio del pago
Un concepto de solución en la teoría de juegos
Relación
Subconjunto de	equilibrio de Nash
Significado
Propuesto por	John Harsanyi , Reinhard Selten
Usado para	Juegos no cooperativos
Ejemplo	Caza del ciervo

La matriz de pagos de la Figura 1 proporciona un ejemplo simple de dos jugadores y dos estrategias de un juego con dos equilibrios de Nash puros. El par de estrategias (Hunt, Hunt) domina la recompensa, ya que las recompensas son más altas para ambos jugadores en comparación con el otro NE puro (Gather, Gather). Por otro lado, (Reunir, recolectar) el riesgo domina (Cazar, Cazar) ya que si existe incertidumbre sobre la acción del otro jugador, la recolección proporcionará una mayor recompensa esperada. El juego de la Figura 1 es un conocido dilema de la teoría del juego llamado caza del ciervo . La razón fundamental es que la acción comunitaria (cazar) produce un mayor rendimiento si todos los jugadores combinan sus habilidades, pero si se desconoce si el otro jugador ayuda en la caza, la recolección podría resultar la mejor estrategia individual para el suministro de alimentos, ya que no depende de la coordinación con el otro jugador. Además, se prefiere reunirse solo a reunirse en competencia con otros. Al igual que el dilema del prisionero , proporciona una razón por la que la acción colectiva puede fracasar en ausencia de compromisos creíbles .

	Cazar	Recolectar
Cazar	5, 5	0, 4
Recolectar	4, 0	2, 2
Fig.1: Ejemplo de caza del ciervo

	H	GRAMO
H	A, a	C, b
GRAMO	Antes de Cristo	D, d
Fig.2: Juego de coordinación genérico

Definicion formal

El juego que se muestra en la Figura 2 es un juego de coordinación si las siguientes desigualdades de pago se mantienen para el jugador 1 (filas): A> B, D> C, y para el jugador 2 (columnas): a> b, d> c. Los pares de estrategias (H, H) y (G, G) son los únicos equilibrios de Nash puros . Además, existe un equilibrio de Nash mixto donde el jugador 1 juega H con probabilidad p = (dc) / (ab-c + d) y G con probabilidad 1 – p; el jugador 2 juega H con probabilidad q = (DC) / (AB-C + D) y G con probabilidad 1 – q.

El pago del par de estrategias (H, H) domina (G, G) si A ≥ D, a ≥ d, y al menos uno de los dos es una desigualdad estricta: A> D o a> d.

El riesgo del par de estrategias (G, G) domina (H, H) si el producto de las pérdidas por desviación es mayor para (G, G) (Harsanyi y Selten, 1988, Lema 5.4.4). En otras palabras, si se cumple la siguiente desigualdad: (C - D) (c - d) ≥ (B - A) (b - a) . Si la desigualdad es estricta, entonces (G, G) domina estrictamente el riesgo (H, H). ² (es decir, los jugadores tienen más incentivos para desviarse).

Si el juego es simétrico, entonces si A = a, B = b, etc., la desigualdad permite una interpretación simple: asumimos que los jugadores no están seguros de qué estrategia elegirá el oponente y asignarán probabilidades para cada estrategia. Si cada jugador asigna probabilidades ½ a H y G cada uno, entonces (G, G) el riesgo domina (H, H) si la recompensa esperada de jugar G excede la recompensa esperada de jugar H: ½ B + ½ D ≥ ½ A + ½ C , o simplemente B + D ≥ A + C .

Otra forma de calcular el equilibrio de riesgo dominante es calcular el factor de riesgo para todos los equilibrios y encontrar el equilibrio con el factor de riesgo más pequeño. Para calcular el factor de riesgo en nuestro juego 2x2, considere la recompensa esperada para un jugador si juega H: ${\ Displaystyle E [\ pi _ {H}] = pA + (1-p) C}$ (donde p es la probabilidad de que el otro jugador juegue H) y compárelo con la recompensa esperada si juega G: ${\ Displaystyle E [\ pi _ {G}] = pB + (1-p) D}$ . El valor de p que iguala estos dos valores esperados es el factor de riesgo para el equilibrio (H, H), con ${\ Displaystyle 1-p}$ el factor de riesgo para jugar (G, G). También puede calcular el factor de riesgo para jugar (G, G) haciendo el mismo cálculo, pero estableciendo p como la probabilidad de que el otro jugador juegue G. Una interpretación de p es que es la probabilidad más pequeña de que el oponente deba jugar esa estrategia. de tal manera que la recompensa de la persona por copiar la estrategia del oponente es mayor que si se jugara la otra estrategia.

Selección de equilibrio

Varios enfoques evolutivos han establecido que cuando se juega en una gran población, los jugadores pueden dejar de jugar la estrategia de equilibrio dominante de pago y, en cambio, terminar en el equilibrio dominante de riesgo, dominado por pago. Dos modelos evolutivos separados apoyan la idea de que es más probable que ocurra el equilibrio de riesgo dominante. El primer modelo, basado en la dinámica del replicador , predice que es más probable que una población adopte el equilibrio de riesgo dominante que el equilibrio de pago dominante. El segundo modelo, basado en la revisión y mutación de la estrategia de mejor respuesta , predice que el estado de riesgo dominante es el único equilibrio estocásticamente estable . Ambos modelos asumen que se juegan múltiples juegos de dos jugadores en una población de N jugadores. Los jugadores se emparejan aleatoriamente con oponentes, y cada jugador tiene la misma probabilidad de sacar a cualquiera de los otros N-1 jugadores. Los jugadores comienzan con una estrategia pura, G o H, y juegan esta estrategia contra su oponente. En la dinámica del replicador, el juego de la población se repite en generaciones secuenciales donde las subpoblaciones cambian en función del éxito de sus estrategias elegidas. En la mejor respuesta, los jugadores actualizan sus estrategias para mejorar los beneficios esperados en las generaciones posteriores. El reconocimiento de Kandori, Mailath y Rob (1993) y Young (1993) fue que si la regla para actualizar la propia estrategia permite la mutación ⁴ y la probabilidad de mutación desaparece, es decir, asintóticamente llega a cero con el tiempo, la probabilidad de que el riesgo dominante el equilibrio que se alcanza va a uno, incluso si está dominado por la recompensa. ³

Notas

^ 1 Un solo equilibrio de Nash es trivialmente una recompensa y un riesgo dominante si es el único NE en el juego.
^ 2 Existen distinciones similares entre estricto y débil para la mayoría de las definiciones aquí, pero no se indican explícitamente a menos que sea necesario.
^ 3 Harsanyi y Selten (1988) proponen que el equilibrio dominante de pago es la elección racional en el juego de la caza del ciervo, sin embargo Harsanyi (1995) se retractó de esta conclusión para tomar la dominancia del riesgo como el criterio de selección relevante.

Referencias

Samuel Bowles: Microeconomía: comportamiento, instituciones y evolución , Princeton University Press, págs. 45–46 (2004) ISBN 0-691-09163-3
Drew Fudenberg y David K. Levine: La teoría del aprendizaje en los juegos , MIT Press, p. 27 (1999) ISBN 0-262-06194-5
John C. Harsanyi: "Una nueva teoría de la selección de equilibrio para juegos con información completa", Juegos y comportamiento económico 8, págs. 91-122 (1995)
John C.Harsanyi y Reinhard Selten: una teoría general de la selección de equilibrio en los juegos , MIT Press (1988) ISBN 0-262-08173-3
Michihiro Kandori , George J. Mailath y Rafael Rob : "Aprendizaje, mutación y equilibrios a largo plazo en los juegos", Econometrica 61, págs. 29–56 (1993) Resumen
Roger B. Myerson: teoría de juegos, análisis de conflictos , Harvard University Press, págs. 118-119 (1991) ISBN 0-674-34115-5
Larry Samuelson : Juegos evolutivos y selección de equilibrio , MIT Press (1997) ISBN 0-262-19382-5
H. Peyton Young: "La evolución de las convenciones", Econometrica , 61, págs. 57-84 (1993) Resumen
H. Peyton Young: Estrategia individual y estructura social , Princeton University Press (1998) ISBN 0-691-08687-7

1