Juego en forma normal

En teoría de juegos , la forma normal es una descripción de un juego . A diferencia de la forma extensa , las representaciones en forma normal no son gráficas per se , sino que representan el juego mediante una matriz . Si bien este enfoque puede ser de mayor utilidad para identificar estrategias estrictamente dominadas y equilibrios de Nash , parte de la información se pierde en comparación con las representaciones de forma extensiva. La representación en forma normal de un juego incluye todas las estrategias perceptibles y concebibles , y sus correspondientes recompensas, para cada jugador.

En los juegos estáticos de información completa y perfecta , una representación en forma normal de un juego es una especificación de los espacios de estrategia de los jugadores y las funciones de pago. Un espacio de estrategia para un jugador es el conjunto de todas las estrategias disponibles para ese jugador, mientras que una estrategia es un plan de acción completo para cada etapa del juego, independientemente de si esa etapa realmente surge en el juego. Una función de pago para un jugador es un mapeo del producto cruzado de los espacios de estrategia de los jugadores al conjunto de pagos de ese jugador (normalmente el conjunto de números reales, donde el número representa una utilidad cardinal u ordinal—A menudo cardinal en la representación de forma normal) de un jugador, es decir, la función de pago de un jugador toma como entrada un perfil de estrategia (que es una especificación de estrategias para cada jugador) y produce una representación de pago como resultado.

La matriz proporcionada es una representación en forma normal de un juego en el que los jugadores se mueven simultáneamente (o al menos no observan el movimiento del otro jugador antes de realizar el suyo) y reciben los pagos especificados para las combinaciones de acciones jugadas. Por ejemplo, si el jugador 1 juega arriba y el jugador 2 juega a la izquierda, el jugador 1 recibe 4 y el jugador 2 recibe 3. En cada celda, el primer número representa la recompensa para el jugador de la fila (en este caso, el jugador 1), y el segundo número representa la recompensa para el jugador de la columna (en este caso, el jugador 2).

A menudo, los juegos simétricos (donde las recompensas no dependen de qué jugador elige cada acción) se representan con una sola recompensa. Esta es la recompensa para el jugador de fila. Por ejemplo, las matrices de pagos a la derecha e izquierda a continuación representan el mismo juego.

El espacio topológico de los juegos con matrices de pagos relacionadas también se puede mapear, y los juegos adyacentes tienen las matrices más similares. Esto muestra cómo los cambios de incentivos incrementales pueden cambiar el juego.

La matriz de pagos facilita la eliminación de estrategias dominadas , y generalmente se usa para ilustrar este concepto. Por ejemplo, en el dilema del prisionero , podemos ver que cada prisionero puede "cooperar" o "desertar". Si exactamente un prisionero deserta, se escapa fácilmente y el otro prisionero es encerrado durante mucho tiempo. Sin embargo, si ambos desertan, ambos serán encerrados por un tiempo más corto. Se puede determinar que Cooperar está estrictamente dominado por Defecto . Uno debe comparar los primeros números en cada columna, en este caso 0> −1 y −2> −5. Esto muestra que no importa lo que elija el jugador de la columna, el jugador de la fila lo hace mejor eligiendo Defecto. De manera similar, se compara la segunda recompensa en cada fila; nuevamente 0> −1 y −2> −5. Esto muestra que no importa lo que haga la fila, la columna funciona mejor al elegir Defecto . Esto demuestra que el equilibrio de Nash único de este juego es ( Defecto , Defecto ).

Una topología parcial de juegos de dos jugadores y dos estrategias, incluidos juegos como El dilema del prisionero , Caza de ciervo y Pollo.

Ilustración de forma tanto extensa como normal de un juego secuencial con equilibrios de Nash imperfectos y perfectos en subjuegos marcados con rojo y azul respectivamente.