Juego repetido


En teoría de juegos , un juego repetido es un juego de forma extensiva que consiste en una serie de repeticiones de algún juego base (llamado juego de escenario ). El juego de escenario suele ser uno de los juegos de 2 personas más estudiados . Los juegos repetidos capturan la idea de que un jugador tendrá que tener en cuenta el impacto de su acción actual en las acciones futuras de otros jugadores; este impacto a veces se llama su reputación. Juego de una sola etapa o juego de un solo disparo son nombres para juegos que no se repiten.

Para el ejemplo de la vida real de un juego repetido, considere dos estaciones de servicio adyacentes entre sí. Compiten publicando precios y tienen el mismo costo marginal constante c (el precio al por mayor de la gasolina). Suponga que cuando ambos cobran p = 10, su beneficio conjunto se maximiza, lo que resulta en un beneficio alto para todos. A pesar de que este es el mejor resultado para ellos, están motivados a desviarse. Al bajar modestamente el precio, cualquiera puede robar a todos los consumidores de sus competidores, duplicando sus ingresos (casi). P = c, donde su beneficio es cero, es el único precio sin esta desviación del beneficio. En otras palabras, en el juego de la competencia de precios, el único equilibrio de Nash es ineficiente (para las estaciones de servicio) porque ambos cobran p = c. Esto es más una regla que una excepción: en un juego por etapas,el equilibrio de Nash es el único resultado que un agente puede adquirir de manera consistente en una interacción y, por lo general, es ineficiente para ellos. Esto se debe a que los agentes solo se preocupan por sus propios intereses personales y no se preocupan por los beneficios o costos que sus acciones traen a los competidores. Por otro lado, las estaciones de servicio obtienen ganancias incluso si hay otra estación de servicio adyacente. Una de las razones más importantes es que su interacción no es única. Esta condición está representada por juegos repetidos, en los que dos estaciones de servicio compiten por precios (juegos de escenario) en un rango de tiempo indefinido t = 0, 1, 2, ....Esto se debe a que los agentes solo se preocupan por sus propios intereses personales y no se preocupan por los beneficios o costos que sus acciones traen a los competidores. Por otro lado, las estaciones de servicio obtienen ganancias incluso si hay otra estación de servicio adyacente. Una de las razones más importantes es que su interacción no es única. Esta condición está representada por juegos repetidos, en los que dos estaciones de servicio compiten por precios (juegos de escenario) en un rango de tiempo indefinido t = 0, 1, 2, ....Esto se debe a que los agentes solo se preocupan por sus propios intereses personales y no se preocupan por los beneficios o costos que sus acciones traen a los competidores. Por otro lado, las estaciones de servicio obtienen ganancias incluso si hay otra estación de servicio adyacente. Una de las razones más importantes es que su interacción no es única. Esta condición está representada por juegos repetidos, en los que dos estaciones de servicio compiten por precios (juegos de escenario) en un rango de tiempo indefinido t = 0, 1, 2, ....2, ....2, ....

Los juegos repetidos pueden dividirse en dos clases, finitos e infinitos, dependiendo de cuánto tiempo se esté jugando.

Incluso si el juego que se juega en cada ronda es idéntico, repetir ese juego un número finito o infinito de veces puede, en general, conducir a resultados (equilibrios) muy diferentes, así como a estrategias óptimas muy diferentes.

Los juegos repetidos más estudiados son los que se repiten un número infinito de veces. En los juegos repetidos del dilema del prisionero , se encuentra que la estrategia preferida no es jugar una estrategia de Nash del juego de escenario, sino cooperar y jugar una estrategia socialmente óptima. Una parte esencial de las estrategias en un juego infinitamente repetido es castigar a los jugadores que se desvían de esta estrategia cooperativa. El castigo puede ser jugar una estrategia que conduzca a una reducción de la recompensa para ambos jugadores durante el resto del juego (llamada estrategia de activación). Un jugador normalmente puede optar por actuar de manera egoísta para aumentar su propia recompensa en lugar de jugar la estrategia socialmente óptima. Sin embargo, si se sabe que el otro jugador está siguiendo una estrategia de activación, el jugador espera recibir pagos reducidos en el futuro si se desvían en esta etapa. Una estrategia de disparo efectiva asegura que cooperar tenga más utilidad para el jugador que actuar egoístamente ahora y enfrentar el castigo del otro jugador en el futuro.

Hay muchos resultados en teoremas que tratan sobre cómo lograr y mantener un equilibrio socialmente óptimo en juegos repetidos. Estos resultados se denominan colectivamente "Teoremas populares" . Una característica importante de un juego repetido es la forma en que se pueden modelar las preferencias de un jugador. Hay muchas formas diferentes en las que se puede modelar una relación de preferencia en un juego repetido infinitamente, pero dos claves son: