Considere un juego de tres jugadores, I, II y III, enfrentando, respectivamente, las estrategias {T, B}, {L, R} y {l, r}. Sin más restricciones, se requerirían 3 * 2 3 = 24 valores de utilidad para describir tal juego. | ||||
L , l | L , r | R , l | R , r | |
---|---|---|---|---|
T | 4 , 6 , 2 | 5 , 5 , 5 | 8 , 1 , 7 | 1 , 4 , 9 |
B | 8 , 6 , 6 | 7 , 4 , 7 | 9 , 6 , 5 | 0 , 3 , 0 |
Para cada perfil de estrategia, la utilidad del primer jugador aparece en primer lugar ( rojo ), y le siguen las utilidades del segundo jugador ( verde ) y del tercer jugador ( azul ). |
En la teoría algorítmica de juegos , un juego sucinto o un juego sucintamente representable es un juego que puede representarse en un tamaño mucho más pequeño que su representación de forma normal . Sin imponer restricciones a las utilidades de los jugadores, describir un juego de jugadores, cada uno enfrentando estrategias , requiere enumerar los valores de las utilidades. Incluso los algoritmos triviales son capaces de encontrar un equilibrio de Nash en un polinomio de tiempo en la longitud de una entrada tan grande. Un juego sucinto es de tipo polinomial si en un juego representado por una cadena de longitud n el número de jugadores, así como el número de estrategias de cada jugador, está delimitado por un polinomio en n [1] ( Papadimitriou y Roughgarden 2008 [2] dan una definición formal que describe los juegos sucintos como un problema computacional ) .
Digamos que la utilidad de cada jugador depende solo de su propia acción y la acción de otro jugador; por ejemplo, I depende de II, II de III y III de I. Representar un juego de este tipo requeriría solo tres tablas de utilidad 2x2, que contengan en total solo 12 valores de utilidad.
|
Los juegos gráficos son juegos en los que las utilidades de cada jugador dependen de las acciones de muy pocos jugadores. Si es el mayor número de jugadores por cuyas acciones se ve afectado un solo jugador (es decir, es el grado de la gráfica del juego), el número de valores de utilidad necesarios para describir el juego es , que, para un pequeño, es una mejora considerable. .
Se ha demostrado que cualquier juego de forma normal se puede reducir a un juego gráfico con todos los grados delimitados por tres y con dos estrategias para cada jugador. [3] A diferencia de los juegos de forma normal, el problema de encontrar un equilibrio de Nash puro en juegos gráficos (si existe) es NP-completo . [4] El problema de encontrar un equilibrio de Nash (posiblemente mixto) en un juego gráfico es PPAD -completo. [5] Encontrar un equilibrio correlacionado de un juego gráfico se puede hacer en tiempo polinomial, y para una gráfica con un ancho de árbol acotado , esto también es cierto para encontrar un equilibrio correlacionado óptimo . [2]
Cuando la mayoría de las utilidades son 0, como se muestra a continuación, es fácil obtener una representación sucinta. | ||||
L , l | L , r | R , l | R , r | |
---|---|---|---|---|
T | 0 , 0 , 0 | 2 , 0 , 1 | 0 , 0 , 0 | 0 , 7 , 0 |
B | 0 , 0 , 0 | 0 , 0 , 0 | 2 , 0 , 3 | 0 , 0 , 0 |
Los juegos dispersos son aquellos en los que la mayoría de las utilidades son cero. Los juegos gráficos pueden verse como un caso especial de juegos dispersos.
Para un juego de dos jugadores, un juego disperso puede definirse como un juego en el que cada fila y columna de las dos matrices de pago (utilidad) tiene como máximo un número constante de entradas distintas de cero. Se ha demostrado que la búsqueda de un equilibrio de Nash en un juego tan escasa es PPAD-dura, y que no existe un completo esquema de aproximación de tiempo polinomial a menos PPAD está en P . [6]
Supongamos que los tres jugadores son idénticos (los colorearemos todos de morado ) y se enfrentan al conjunto de estrategias {T, B}. Sea #TP y #BP el número de compañeros de un jugador que han elegido T y B, respectivamente. Describir este juego requiere solo 6 valores de utilidad.
|
En los juegos simétricos, todos los jugadores son idénticos, por lo que al evaluar la utilidad de una combinación de estrategias, lo único que importa es cuántos de los jugadores juegan cada una de las estrategias. Por lo tanto, describir un juego de este tipo requiere dar solo valores de utilidad.
En un juego simétrico con 2 estrategias, siempre existe un equilibrio de Nash puro, aunque puede que no exista un equilibrio de Nash puro simétrico . [7] El problema de encontrar un equilibrio de Nash puro en un juego simétrico (posiblemente con más de dos jugadores) con un número constante de acciones está en AC 0 ; sin embargo, cuando el número de acciones crece con el número de jugadores (incluso linealmente), el problema es NP-completo. [8] En cualquier juego simétrico existe un equilibrio simétrico . Dado un juego simétrico de n jugadores que enfrentan k estrategias, se puede encontrar un equilibrio simétrico en el tiempo polinómico si k = . [9]Encontrar un equilibrio correlacionado en juegos simétricos se puede hacer en tiempo polinomial. [2]
Si los jugadores fueran diferentes pero no distinguieran entre otros jugadores, necesitaríamos enumerar 18 valores de utilidad para representar el juego, una tabla como la que se da para los "juegos simétricos" para cada jugador.
|
En los juegos anónimos , los jugadores tienen diferentes utilidades, pero no distinguen entre otros jugadores (por ejemplo, tener que elegir entre "ir al cine" e "ir al bar" sin preocuparse solo por la cantidad de gente que habrá en cada lugar, no por con quién se encontrarán allí). En un juego así, la utilidad de un jugador depende nuevamente de cuántos de sus compañeros elijan qué estrategia y la suya propia, por lo que se requieren valores de utilidad.
Si el número de acciones crece con el número de jugadores, encontrar un equilibrio de Nash puro en un juego anónimo es NP-difícil . [8] Se puede encontrar un equilibrio correlacionado óptimo de un juego anónimo en el tiempo polinomial. [2] Cuando el número de estrategias es 2, existe un PTAS conocido para encontrar un equilibrio de Nash ε-aproximado . [10]
Si el juego en cuestión fuera un juego de polímatrix, describirlo requeriría 24 valores de utilidad. Para simplificar, examinemos solo las utilidades del jugador I (necesitaríamos dos tablas más para cada uno de los otros jugadores).
Si se eligiera el perfil de estrategia (B, R, l), la utilidad del jugador I sería 9 + 8 = 17, la utilidad del jugador II sería 1 + 2 = 3 y la utilidad del jugador III sería 6 + 4 = 10. |
En un juego de Polymatrix (también conocido como un juego multimatrix ), hay una matriz de utilidad para cada par de jugadores (i, j) , que denota un componente del jugador de utilidad i de. La utilidad final del jugador i es la suma de todos esos componentes. El número de valores de utilidades necesarios para representar un juego de este tipo es .
Los juegos de Polymatrix siempre tienen al menos un equilibrio de Nash mixto. [11] El problema de encontrar un equilibrio de Nash en un juego polimatriz es PPAD-completo. [5] Además, el problema de encontrar un equilibrio de Nash aproximado constante en un juego de polimatriz también es PPAD-completo. [12] Encontrar un equilibrio correlacionado de un juego polimatriz se puede hacer en tiempo polinomial. [2] Tenga en cuenta que incluso si los juegos por parejas que se juegan entre jugadores tienen equilibrios de Nash puros, la interacción global no admite necesariamente un equilibrio de Nash puro (aunque debe existir un equilibrio de Nash mixto).
Los juegos competitivos de polimatriz con solo interacciones de suma cero entre jugadores son una generalización de los juegos de suma cero para dos jugadores . El teorema de Minimax, originalmente formulado para juegos de dos jugadores por von Neumann, se generaliza a juegos de polímatriz de suma cero. [13] Al igual que los juegos de suma cero de dos jugadores, los juegos de suma cero polimatriz tienen equilibrios de Nash mixtos que se pueden calcular en tiempo polinómico y esos equilibrios coinciden con equilibrios correlacionados . Pero algunas otras propiedades de los juegos de suma cero para dos jugadores no se generalizan. En particular, los jugadores no necesitan tener un valor único.del juego y las estrategias de equilibrio no son estrategias de máximo-mínimo en el sentido de que las ganancias de los jugadores en el peor de los casos no se maximizan cuando se usa una estrategia de equilibrio. Existe una biblioteca Python de código abierto [14] para simular juegos polimatrix competitivos.
Los juegos de Polymatrix que tienen juegos de coordinación en sus bordes son juegos potenciales [15] y pueden resolverse usando un método de función potencial.
Comparemos ahora las diversas estrategias de los jugadores con los valores booleanos "0" y "1", y dejemos que X represente la elección del jugador I, Y la elección del jugador II y Z para la elección del jugador III. Asignemos a cada jugador un circuito: Jugador I: X ∧ (Y ∨ Z) Estos describen la tabla de utilidades a continuación. | ||||
0 , 0 | 0 , 1 | 1 , 0 | 1 , 1 | |
---|---|---|---|---|
0 | 0 , 0 , 0 | 0 , 1 , 0 | 0 , 1 , 1 | 0 , 0 , 1 |
1 | 0 , 1 , 1 | 1 , 0 , 1 | 1 , 0 , 1 | 1 , 1 , 1 |
La forma más flexible de representar un juego sucinto es representar a cada jugador mediante una máquina de Turing delimitada por tiempo polinomial , que toma como entrada las acciones de todos los jugadores y genera la utilidad del jugador. Tal máquina de Turing es equivalente a un circuito booleano , y es esta representación, conocida como juegos de circuitos , la que consideraremos.
Calcular el valor de un juego de circuito de suma cero de 2 jugadores es un problema completo de EXP , [16] y se sabe que la aproximación del valor de dicho juego hasta un factor multiplicativo está en PSPACE . [17] Determinar si existe un equilibrio de Nash puro es un problema completo (consulte Jerarquía de polinomios ). [18]
Existen muchos otros tipos de juegos sucintos (muchos tienen que ver con la asignación de recursos). Los ejemplos incluyen juegos de congestión , juegos de congestión de la red , juegos de programación , juegos de efectos locales , juegos de localización de servicios , juegos de acción y de gráficos , juegos hypergraphical y más.
A continuación se muestra una tabla de algunos resultados de complejidad conocidos para encontrar ciertas clases de equilibrios en varias representaciones de juegos. "NE" significa "equilibrio de Nash" y "CE" para "equilibrio correlacionado". n es el número de jugadores y s es el número de estrategias que enfrenta cada jugador (asumimos que todos los jugadores enfrentan el mismo número de estrategias). En los juegos gráficos, d es el grado máximo de la gráfica del juego. Para obtener referencias, consulte el texto del artículo principal.
Representación | Tamaño ( O (...)) | NE puro | NE mixto | CE | CE óptima |
---|---|---|---|---|---|
Juego en forma normal | NP-completo | PPAD-completo | PAG | PAG | |
Juego grafico | NP-completo | PPAD-completo | PAG | NP-duro | |
Juego simétrico | NP-completo | El cálculo del equilibrio de Nash simétrico es PPAD-difícil para dos jugadores. El cálculo del equilibrio de Nash no simétrico para dos jugadores es NP-completo. | PAG | PAG | |
Juego anónimo | NP-duro | PAG | PAG | ||
Juego de Polymatrix | PPAD-completo (polinomio para polimatriz de suma cero) | PAG | NP-duro | ||
Juego de circuito | -completo | ||||
Juego de congestión | PLS-completo | PAG | NP-duro |