Gatillo sombrío

En la teoría de juegos , el desencadenante sombrío (también llamado estrategia sombría o simplemente sombrío ) es una estrategia desencadenante para un juego repetido.

Inicialmente, un jugador que usa un gatillo sombrío cooperará, pero tan pronto como el oponente falle (satisfaciendo así la condición del gatillo), el jugador que usa un gatillo sombrío desertará por el resto del juego iterado. Dado que un solo defecto del oponente desencadena la deserción para siempre, el desencadenante sombrío es la estrategia más estrictamente implacable en un juego repetido.

En el libro de Robert Axelrod La evolución de la cooperación , el desencadenante sombrío se llama "Friedman", por un artículo de 1971 de James Friedman, que utiliza el concepto. ^[1]

El dilema de los prisioneros infinitamente repetido

El dilema de los prisioneros infinitamente repetido es un ejemplo bien conocido de la estrategia del desencadenante siniestro. El juego normal para dos prisioneros es el siguiente:

Prisionero B Prisionero A	Permanece en silencio (coopera)	Traicionar (defecto)
Permanece en silencio (coopera)	1, 1	-1, 2
Traicionar (defecto)	2, -1	0, 0

En el dilema de los prisioneros, cada jugador tiene dos opciones en cada etapa:

Cooperar
Defecto para una ganancia inmediata

Si un jugador deserta, será castigado por el resto del juego. De hecho, es mejor para ambos jugadores permanecer en silencio (cooperar) que traicionar al otro, por lo que jugar (C, C) es el perfil cooperativo mientras se juega (D, D), también el equilibrio de Nash único en este juego, es el perfil de castigo.

En la estrategia de desencadenamiento sombrío, un jugador coopera en la primera ronda y en las rondas siguientes siempre que su oponente no se desvíe del acuerdo. Una vez que el jugador descubre que el oponente ha traicionado en el juego anterior, desertará para siempre.

Con el fin de evaluar el equilibrio perfecto en subjuegos (SPE) para la siguiente estrategia de activación sombría del juego, la estrategia S * para los jugadores i y j es la siguiente:

Juega C en cada período a menos que alguien haya jugado D en el pasado
Juega D para siempre si alguien ha jugado D en el pasado ^[2]

Entonces, la estrategia es una SPE solo si el factor de descuento es ${\ textstyle \ delta \ geq {\ frac {1} {2}}}$ . En otras palabras, ni el Jugador 1 ni el Jugador 2 están incentivados a abandonar el perfil de cooperación si el factor de descuento es mayor a la mitad. ^[3]

Para demostrar que la estrategia es una SPE, la cooperación debe ser la mejor respuesta a la cooperación del otro jugador, y la deserción debe ser la mejor respuesta a la deserción del otro jugador. ^[2]

Paso 1: Suponga que D nunca se juega hasta ahora.

Pago del jugador i de C: ${\ Displaystyle (1- \ delta) [1+ \ delta + \ delta ^ {2} + ...] = (1- \ delta) \ times {\ frac {1} {1- \ delta}} = 1 }$
Pago del jugador i de D: ${\ displaystyle (1- \ delta) [2 + 0 + 0 + ...] = 2 (1- \ delta)}$

Entonces, C es mejor que D si ${\ Displaystyle 1 \ geq 2 (1- \ delta)}$ . Esto muestra que si ${\ Displaystyle \ delta \ geq {\ frac {1} {2}}}$ , jugar C es óptimo de Pareto .

Paso 2: Suponga que alguien ha jugado D anteriormente, entonces el jugador j jugará D pase lo que pase.

Pago del jugador i de C: ${\ Displaystyle (1- \ delta) [- 1+ \ delta \ times 0+ \ delta ^ {2} \ times 0 + ...] = (1- \ delta) \ times -1 = \ delta -1}$
Pago del jugador i de D: ${\ Displaystyle (1- \ delta) [0+ \ delta \ times 0+ \ delta ^ {2} \ times 0 + ...] = 0}$

Desde ${\ Displaystyle 0 \ leq \ delta \ leq 1}$ , tocar D es óptimo.

El argumento anterior enfatiza que no hay incentivo para desviarse (sin desviación rentable) del perfil de cooperación si ${\ Displaystyle \ delta \ geq {\ frac {1} {2}}}$ , y esto es cierto para todos los subjuegos. Por lo tanto, la estrategia para el juego de dilemas de los prisioneros repetidos infinitamente es un equilibrio de Nash perfecto en subjuegos.

En las competiciones repetidas de estrategia de dilema del prisionero, el disparador sombrío funciona mal incluso sin ruido , y la adición de errores de señal lo empeora aún más. Su capacidad para amenazar con la deserción permanente le da una forma teóricamente efectiva de mantener la confianza, pero debido a su naturaleza implacable y la incapacidad de comunicar esta amenaza con anticipación, su desempeño es deficiente. ^[4]

Detonador sombrío en las relaciones internacionales

Bajo el sombrío detonante de la perspectiva de las relaciones internacionales, una nación coopera solo si su socio nunca la ha explotado en el pasado. Debido a que una nación se negará a cooperar en todos los períodos futuros una vez que su socio deseche una vez, la eliminación indefinida de la cooperación se convierte en la amenaza que hace que dicha estrategia sea un caso límite. ^[5] Si bien el desencadenante sombrío es un caso límite, el teorema de Folk establece que se puede lograr un equilibrio perfecto si ambas naciones son pacientes. ^[6]

Desencadenante sombrío en las interacciones entre el usuario y la red

La teoría de juegos se ha utilizado recientemente en el desarrollo de futuros sistemas de comunicaciones, y el usuario en el juego de interacción usuario-red que emplea la estrategia del desencadenante sombrío es uno de esos ejemplos. ^[7] Si se decide usar el desencadenante sombrío en el juego de interacción usuario-red, el usuario permanece en la red (coopera) si la red mantiene una cierta calidad, pero castiga a la red deteniendo la interacción y dejando la red como tan pronto como el usuario descubra los defectos del oponente. ^[8] Antoniou y col. explica que "dada esta estrategia, la red tiene un incentivo más fuerte para mantener la promesa dada por una determinada calidad, ya que se enfrenta a la amenaza de perder a su cliente para siempre". ^[7]

Comparación con otras estrategias

El ojo por ojo y las estrategias de disparo sombrío son de naturaleza similar en el sentido de que ambas son estrategias de disparo en las que un jugador se niega a desertar primero si tiene la capacidad de castigar al oponente por desertar. La diferencia, sin embargo, es que el desencadenante sombrío busca el castigo máximo por una sola deserción, mientras que el ojo por ojo es más indulgente, ofreciendo un castigo por cada deserción. ^[9]

Ver también

Referencias

^ Friedman, James W. (1971). "Un equilibrio no cooperativo para superjuegos". Revisión de estudios económicos . 38 (1): 1–12. doi : 10.2307 / 2296617 .
^ ^a ^b Acemoglu, Daron (2 de noviembre de 2009). "Juegos repetidos y cooperación" .
^ Levin, Jonathan (mayo de 2006). "Juegos repetidos I: Seguimiento perfecto" (PDF) .
^ Axelrod, Robert (2000). "Sobre seis avances en la teoría de la cooperación" (PDF) . Consultado el 2 de noviembre de 2007 . (página 13)
^ McGillivra, Fiona; Smith, Alastair (2000). "Confianza y cooperación a través de castigos específicos del agente". Organización Internacional . 54 (4): 809–824. doi : 10.1162 / 002081800551370 .
^ Fudenberg, Drew; Maskin, Eric (mayo de 1986). "El teorema popular en juegos repetidos con descuento o con información incompleta". Econometrica . 54 (3): 533–554. CiteSeerX 10.1.1.308.5775 . doi : 10.2307 / 1911307 .
^ ^a ^b Antoniou, Josephina; Papadopoulou, Vicky (noviembre de 2009). "Interacciones cooperativas usuario-red en redes de comunicación de próxima generación". Redes informáticas . 54 (13): 2239–2255. doi : 10.1016 / j.comnet.2010.03.013 .
^ Antoniou, Josephina; Petros A, Ioannou (2016). Teoría de juegos en redes de comunicación: resolución cooperativa de escenarios de redes interactivas . Prensa CRC. ISBN 9781138199385.
^ Baurmann, Michael; Leist, Anton (mayo de 2016). "Sobre los seis avances en la teoría de la cooperación". Revista de Filosofía y Teoría Social . 22 (1): 130-151.

[1] Friedman, James W. (1971). "Un equilibrio no cooperativo para superjuegos". Revisión de estudios económicos . 38 (1): 1–12. doi : 10.2307 / 2296617 .

[:0-2] Acemoglu, Daron (2 de noviembre de 2009). "Juegos repetidos y cooperación" .

[3] Levin, Jonathan (mayo de 2006). "Juegos repetidos I: Seguimiento perfecto" (PDF) .

[4] Axelrod, Robert (2000). "Sobre seis avances en la teoría de la cooperación" (PDF) . Consultado el 2 de noviembre de 2007 . (página 13)

[5] McGillivra, Fiona; Smith, Alastair (2000). "Confianza y cooperación a través de castigos específicos del agente". Organización Internacional . 54 (4): 809–824. doi : 10.1162 / 002081800551370 .

[6] Fudenberg, Drew; Maskin, Eric (mayo de 1986). "El teorema popular en juegos repetidos con descuento o con información incompleta". Econometrica . 54 (3): 533–554. CiteSeerX 10.1.1.308.5775 . doi : 10.2307 / 1911307 .

[:1-7] Antoniou, Josephina; Papadopoulou, Vicky (noviembre de 2009). "Interacciones cooperativas usuario-red en redes de comunicación de próxima generación". Redes informáticas . 54 (13): 2239–2255. doi : 10.1016 / j.comnet.2010.03.013 .

[8] Antoniou, Josephina; Petros A, Ioannou (2016). Teoría de juegos en redes de comunicación: resolución cooperativa de escenarios de redes interactivas . Prensa CRC. ISBN 9781138199385.

[9] Baurmann, Michael; Leist, Anton (mayo de 2016). "Sobre los seis avances en la teoría de la cooperación". Revista de Filosofía y Teoría Social . 22 (1): 130-151.

[1]