De Wikipedia, la enciclopedia libre
Saltar a navegación Saltar a búsqueda

En teoría de juegos y teoría económica , un juego de suma cero es una representación matemática de una situación en la que una ventaja ganada por uno de los dos lados se pierde por el otro. [1] Si se suman las ganancias totales de los participantes y se restan las pérdidas totales, sumarán cero. Por lo tanto, cortar un pastel , donde tomar un trozo más significativo reduce la cantidad de pastel disponible para otros tanto como aumenta la cantidad disponible para ese receptor, es un juego de suma cero si todos los participantes valoran cada unidad de pastel por igual . Otros ejemplos de juegos de suma cero en la vida diaria incluyen juegos como póquer , ajedrezy un puente donde una persona gana y otra pierde, lo que resulta en un beneficio neto cero para cada jugador. [2] En los mercados y los instrumentos financieros, los contratos de futuros y las opciones también son juegos de suma cero. [3] Sin embargo, la situación como el mercado de valores, etc. no es un juego de suma cero porque los inversores podrían obtener ganancias o pérdidas de las influencias del precio de las acciones por los pronósticos de ganancias o las perspectivas económicas en lugar de obtener ganancias de otros inversores perdidos.

Por el contrario, la suma distinta de cero describe una situación en la que las ganancias y pérdidas agregadas de las partes que interactúan pueden ser menores o mayores que cero. Un juego de suma cero también se denomina juego estrictamente competitivo , mientras que los juegos de suma no cero pueden ser competitivos o no competitivos. Los juegos de suma cero suelen resolverse con el teorema minimax, que está estrechamente relacionado con la dualidad de programación lineal , [4] o con el equilibrio de Nash . Prisoner's Dilemma es un juego clásico de suma no cero. [5]

Muchas personas tienen un sesgo cognitivo hacia ver situaciones como de suma cero, conocido como sesgo de suma cero .

Definición [ editar ]

La propiedad de suma cero (si uno gana, otro pierde) significa que cualquier resultado de una situación de suma cero es óptimo de Pareto . Generalmente, cualquier juego en el que todas las estrategias son óptimas de Pareto se denomina juego de conflicto. [6]

Los juegos de suma cero son un ejemplo específico de juegos de suma constante donde la suma de cada resultado es siempre cero. [7] Estos juegos son distributivos, no integradores; el pastel no se puede agrandar con una buena negociación.

En situaciones en las que la ganancia (o pérdida) de un tomador de decisiones no necesariamente resulta en la pérdida (o ganancia) de los otros tomadores de decisiones, se les conoce como suma distinta de cero. [8] Por lo tanto, un país con un exceso de plátanos que comercia con otro país por su exceso de manzanas, donde ambos se benefician de la transacción, se encuentra en una situación de suma distinta de cero. Otros juegos de suma distinta de cero son juegos en los que la suma de ganancias y pérdidas de los jugadores es a veces mayor o menor de lo que empezaron.

La idea del pago óptimo de Pareto en un juego de suma cero da lugar a un estándar de racionalidad egoísta relativa generalizado, el estándar de castigar al oponente, donde ambos jugadores siempre buscan minimizar el pago del oponente a un costo favorable para él mismo en lugar de preferir más. que menos. El estándar de castigar al oponente se puede utilizar tanto en juegos de suma cero (p. Ej., Juegos de guerra, ajedrez) como en juegos de suma distinta de cero (p. Ej., Juegos de selección de agrupación). [9] El jugador en el juego tiene un simple deseo de maximizar el beneficio para él, y el oponente desea minimizarlo. [10]

Solución [ editar ]

Para juegos de suma cero finitos de dos jugadores, los diferentes conceptos de solución de la teoría de juegos de equilibrio de Nash , minimax y maximin dan todos la misma solución. Si a los jugadores se les permite jugar una estrategia mixta , el juego siempre tiene un equilibrio.

Ejemplo [ editar ]

La matriz de pagos de un juego es una representación conveniente. Considere estas situaciones como un ejemplo, el juego de suma cero para dos jugadores que se muestra a la derecha o arriba.

El orden de juego procede de la siguiente manera: el primer jugador (rojo) elige en secreto una de las dos acciones 1 o 2; el segundo jugador (azul), sin darse cuenta de la elección del primer jugador, elige en secreto una de las tres acciones A, B o C. Luego, las opciones se revelan y el total de puntos de cada jugador se ve afectado de acuerdo con la recompensa de esas elecciones.

Ejemplo: el rojo elige la acción 2 y el azul elige la acción B. Cuando se asigna la recompensa, el rojo gana 20 puntos y el azul pierde 20 puntos.

En este juego de ejemplo, ambos jugadores conocen la matriz de pagos e intentan maximizar el número de sus puntos. Red podría razonar de la siguiente manera: "Con la acción 2, podría perder hasta 20 puntos y ganar solo 20, y con la acción 1 puedo perder solo 10 pero puedo ganar hasta 30, así que la acción 1 se ve mucho mejor". Con un razonamiento similar, Azul elegiría la acción C. Si ambos jugadores realizan estas acciones, Rojo ganará 20 puntos. Si Azul anticipa el razonamiento de Rojo y la elección de la acción 1, Azul puede elegir la acción B, para ganar 10 puntos. Si Rojo, a su vez, anticipa este truco y va a la acción 2, esto gana a Rojo 20 puntos.

Émile Borel y John von Neumann tuvieron la idea fundamental de que la probabilidad proporciona una salida a este enigma. En lugar de decidir qué acción tomar, los dos jugadores asignan probabilidades a sus respectivas acciones y luego usan un dispositivo aleatorio que, de acuerdo con estas probabilidades, elige una acción para ellos. Cada jugador calcula las probabilidades para minimizar la pérdida máxima esperada de puntos independientemente de la estrategia del oponente. Esto conduce a un problema de programación lineal con las estrategias óptimas para cada jugador. Este método minimax puede calcular estrategias probablemente óptimas para todos los juegos de suma cero de dos jugadores.

Para el ejemplo anterior, resulta que Rojo debería elegir la acción 1 con probabilidad 4/7 y acción 2 con probabilidad 3/7, y Azul debe asignar las probabilidades 0, 4/7, y 3/7 a las tres acciones A, B y C. El rojo ganará 20/7 puntos en promedio por juego.

Resolviendo [ editar ]

El equilibrio de Nash para un juego de suma cero de dos jugadores se puede encontrar resolviendo un problema de programación lineal . Suponga que un juego de suma cero tiene una matriz de pagos M donde el elemento M i , j es el pago obtenido cuando el jugador minimizador elige la estrategia pura i y el jugador maximizador elige la estrategia pura j (es decir, el jugador que intenta minimizar el pago elige la fila y el jugador que intenta maximizar la recompensa elige la columna). Suponga todos los elementos de Mes positivo. El juego tendrá al menos un equilibrio de Nash. El equilibrio de Nash se puede encontrar (Raghavan 1994, p. 740) resolviendo el siguiente programa lineal para encontrar un vector u :

Minimizar:
Sujeto a las limitaciones:
u ≥ 0
M u ≥ 1 .

La primera restricción dice que cada elemento del vector u debe ser no negativo, y la segunda restricción dice que cada elemento del vector M u debe ser al menos 1. Para el vector u resultante , la inversa de la suma de sus elementos es el valor de el juego. Multiplicar u por ese valor da un vector de probabilidad, dando la probabilidad de que el jugador maximizador elija cada posible estrategia pura.

Si la matriz del juego no tiene todos los elementos positivos, agregue una constante a cada elemento que sea lo suficientemente grande como para hacerlos todos positivos. Eso aumentará el valor del juego en esa constante y no afectará las estrategias mixtas de equilibrio para el equilibrio.

La estrategia mixta de equilibrio para el jugador minimizador se puede encontrar resolviendo el dual del programa lineal dado. Alternativamente, se puede encontrar usando el procedimiento anterior para resolver una matriz de pagos modificada que es la transposición y negación de M (agregando una constante para que sea positiva), luego resolviendo el juego resultante.

Si se encuentran todas las soluciones del programa lineal, constituirán todos los equilibrios de Nash del juego. A la inversa, cualquier programa lineal se puede convertir en un juego de suma cero para dos jugadores mediante el uso de un cambio de variables que lo coloque en la forma de las ecuaciones anteriores y, por lo tanto, dichos juegos son equivalentes a los programas lineales, en general. [11]

Solución universal [ editar ]

Si evitar un juego de suma cero es una opción de acción con alguna probabilidad para los jugadores, evitar es siempre una estrategia de equilibrio para al menos un jugador en un juego de suma cero. Para cualquier juego de suma cero de dos jugadores en el que un empate cero-cero es imposible o no creíble después de que se inicia el juego, como el póquer, no existe una estrategia de equilibrio de Nash aparte de evitar el juego. Incluso si hay un empate cero-cero creíble después de que se inicia un juego de suma cero, no es mejor que la estrategia de evitar. En este sentido, es interesante encontrar la recompensa sobre la marcha en el cálculo de la elección óptima que prevalecerá sobre los juegos de suma cero de dos jugadores con respecto al inicio del juego o no. [12]

El ejemplo más común o simple del subcampo de la psicología social es el concepto de " trampas sociales ". En algunos casos, la búsqueda de intereses personales individuales puede mejorar el bienestar colectivo del grupo, pero en otras situaciones, todas las partes que persiguen intereses personales dan como resultado un comportamiento mutuamente destructivo.

Juegos de suma cero para tres personas [ editar ]

Está claro que hay múltiples relaciones entre los jugadores en un juego de tres personas de suma cero, en un juego de dos personas de suma cero, todo lo que un jugador gana lo pierde necesariamente el otro y viceversa; por lo tanto, siempre hay un antagonismo absoluto de intereses, y eso es similar en el juego de tres personas. [13] Se supondría que un movimiento particular de un jugador en un juego de tres personas de suma cero es claramente beneficioso para él y puede perjudicar a los otros dos jugadores, o beneficiar a uno y perjudicar al otro oponente. [13]En particular, el paralelismo de intereses entre dos actores hace deseable una cooperación; puede suceder que un jugador pueda elegir entre varias políticas: entrar en un interés de paralelismo con otro jugador ajustando su conducta, o lo contrario; que puede elegir con cuál de los otros dos jugadores prefiere construir ese paralelismo y en qué medida. [13] La imagen de la izquierda muestra un ejemplo típico de un juego de tres personas de suma cero. Si el jugador 1 elige defender, pero los jugadores 2 y 3 eligen atacar, ambos ganarán un punto. Al mismo tiempo, el jugador 2 perderá dos puntos porque otros jugadores le quitan puntos, y es evidente que los jugadores 2 y 3 tienen un paralelismo de intereses.

Complejidad [ editar ]

Robert Wright ha teorizado en su libro Nonzero: The Logic of Human Destiny , que la sociedad se vuelve cada vez más de suma no cero a medida que se vuelve más compleja, especializada e interdependiente.

Extensiones [ editar ]

En 1944, John von Neumann y Oskar Morgenstern demostraron que cualquier juego de suma distinta de cero para n jugadores es equivalente a un juego de suma cero con n  + 1 jugadores; el  jugador ( n + 1) que representa la ganancia o pérdida global. [14]

Malentendidos [ editar ]

Los críticos de la teoría de juegos comúnmente malinterpretan los juegos de suma cero y, en particular, sus soluciones , generalmente con respecto a la independencia y la racionalidad de los jugadores, así como a la interpretación de las funciones de utilidad. Además, la palabra "juego" no implica que el modelo sea válido solo para juegos recreativos . [4]

A la política a veces se le llama suma cero. [15] [16] [17]

Pensamiento de suma cero [ editar ]

En psicología, el pensamiento de suma cero se refiere a la percepción de que una situación es como un juego de suma cero, donde la ganancia de una persona es la pérdida de otra.

Ver también [ editar ]

  • Juego de bimatrix
  • Ventaja comparativa
  • Enfermedad holandesa
  • Ganancias del comercio
  • Falacia de la masa de trabajo
  • Juego de suma positiva

Referencias [ editar ]

  1. ^ Diccionario de inglés comercial de Cambridge . Cambridge: Cambridge University Press. 2011. ISBN 978-0-521-12250-4. OCLC  741548935 .
  2. ^ Von Neumann, John; Oskar Morgenstern (2007). Teoría de los juegos y comportamiento económico (ed. 60 aniversario). Princeton: Prensa de la Universidad de Princeton. ISBN 978-1-4008-2946-0. OCLC  830323721 .
  3. ^ Kenton, Will. "Juego de suma cero" . Investopedia . Consultado el 25 de abril de 2021 .
  4. ↑ a b Ken Binmore (2007). Jugar de verdad: un texto sobre teoría de juegos . Oxford University Press EE. UU. ISBN 978-0-19-530057-4., capítulos 1 y 7
  5. ^ Chiong, Raymond; Jankovic, Lubo (2008). "Diseño de estrategia de juego de aprendizaje a través del dilema del prisionero iterado" . Revista internacional de aplicaciones informáticas en tecnología . 32 (3): 216. doi : 10.1504 / ijcat.2008.020957 . ISSN 0952-8091 . 
  6. ^ Bowles, Samuel (2004). Microeconomía: comportamiento, instituciones y evolución . Prensa de la Universidad de Princeton . págs.  33 –36. ISBN 0-691-09163-3.
  7. ^ Washburn, Alan (2014). Juegos de suma cero para dos personas . Serie Internacional en Investigación de Operaciones y Ciencias de la Gestión. 201 . Boston, MA: Springer EE. UU. doi : 10.1007 / 978-1-4614-9050-0 . ISBN 978-1-4614-9049-4.
  8. ^ "Juego de suma no cero" . Escuela de Negocios Monash . Consultado el 25 de abril de 2021 .
  9. ^ Wenliang Wang (2015). Pooling Game Theory y Plan Público de Pensiones. ISBN 978-1507658246 . Capítulo 1 y Capítulo 4. 
  10. ^ Von Neumann, John; Oskar Morgenstern (2007). Teoría de los juegos y comportamiento económico (ed. 60 aniversario). Princeton: Prensa de la Universidad de Princeton. pag. 98. ISBN 978-1-4008-2946-0. OCLC  830323721 .
  11. ^ Ilan Adler (2012) La equivalencia de programas lineales y juegos de suma cero. Saltador
  12. ^ Wenliang Wang (2015). Pooling Game Theory y Plan Público de Pensiones. ISBN 978-1507658246 . Capítulo 4. 
  13. ^ a b c Von Neumann, John; Oskar Morgenstern (2007). Teoría de los juegos y comportamiento económico (ed. 60 aniversario). Princeton: Prensa de la Universidad de Princeton. págs. 220-223. ISBN 978-1-4008-2946-0. OCLC  830323721 .
  14. ^ Teoría de juegos y comportamiento económico . Prensa de la Universidad de Princeton (1953). 25 de junio de 2005. ISBN 9780691130613. Consultado el 25 de febrero de 2018 .
  15. Rubin, Jennifer (4 de octubre de 2013). "La falla en la política de suma cero" . The Washington Post . Consultado el 8 de marzo de 2017 .
  16. ^ "Lexington: política de suma cero" . The Economist . 2014-02-08 . Consultado el 8 de marzo de 2017 .
  17. ^ "Juego de suma cero | Definir juego de suma cero en" . Dictionary.com . Consultado el 8 de marzo de 2017 .

Lectura adicional [ editar ]

  • Declarar erróneamente el concepto de juegos de suma cero dentro del contexto de las estrategias comerciales de deportes profesionales , serie Pardon the Interruption (2010-09-23) ESPN , creada por Tony Kornheiser y Michael Wilbon , actuación de Bill Simmons
  • Handbook of Game Theory - volumen 2 , capítulo Juegos de dos personas de suma cero , (1994) Elsevier Amsterdam, por Raghavan, TES, editado por Aumann y Hart, págs. 735–759, ISBN 0-444-89427-6 
  • Poder: sus formas, bases y usos (1997) Transaction Publishers, por Dennis Wrong [ falta el ISBN ]

Enlaces externos [ editar ]

  • Juega juegos de suma cero en línea de Elmer G. Wiens.
  • Teoría de juegos y sus aplicaciones : texto completo sobre psicología y teoría de juegos. (Contenido y prefacio de la segunda edición).
  • Un juego jugable de suma cero y su equilibrio de Nash de estrategia mixta.