El equilibrio de respuesta cuántica ( QRE ) es un concepto de solución en la teoría de juegos . Introducido por primera vez por Richard McKelvey y Thomas Palfrey , [1] [2] proporciona una noción de equilibrio con racionalidad limitada . QRE no es un refinamiento de equilibrio y puede dar resultados significativamente diferentes del equilibrio de Nash . QRE solo se define para juegos con estrategias discretas, aunque existen análogos de estrategia continua.
Equilibrio de respuesta cuántica | |
---|---|
Un concepto de solución en la teoría de juegos | |
Relación | |
Superconjunto de | Equilibrio de Nash , equilibrio logit |
Significado | |
Propuesto por | Richard McKelvey y Thomas Palfrey |
Usado para | Juegos no cooperativos |
Ejemplo | El dilema del viajero |
En un equilibrio de respuesta cuántica, se supone que los jugadores cometen errores al elegir qué estrategia pura jugar. La probabilidad de que se elija una estrategia en particular está relacionada positivamente con la recompensa de esa estrategia. En otras palabras, es poco probable que se produzcan errores muy costosos.
El equilibrio surge de la realización de creencias. Los pagos de un jugador se calculan en función de las creencias sobre la distribución de probabilidad de otros jugadores sobre las estrategias. En equilibrio, las creencias de un jugador son correctas.
Aplicación a los datos
Cuando se analizan datos del juego de juegos reales, particularmente de experimentos de laboratorio , particularmente de experimentos con el juego de monedas de un centavo , el equilibrio de Nash puede ser implacable. Cualquier movimiento que no sea de equilibrio puede parecer igualmente "incorrecto", pero de manera realista no debería usarse para rechazar una teoría. QRE permite que todas las estrategias se jueguen con una probabilidad distinta de cero, por lo que cualquier dato es posible (aunque no necesariamente razonable).
Equilibrio logit
La especificación más común para QRE es el equilibrio logit ( LQRE ). En un equilibrio logit, las estrategias del jugador se eligen de acuerdo con la distribución de probabilidad:
es la probabilidad de jugador elegir estrategia . es la utilidad esperada para el jugador de elegir estrategia bajo la creencia de que otros jugadores están jugando de acuerdo con la distribución de probabilidad . Tenga en cuenta que la densidad de "creencia" en la recompensa esperada en el lado derecho debe coincidir con la densidad de elección en el lado izquierdo. Por lo tanto, calcular las expectativas de cantidades observables, como la recompensa, la demanda, la producción, etc., requiere encontrar puntos fijos como en la teoría del campo medio . [3]
Para juegos dinámicos
Para juegos dinámicos ( forma extensiva ), McKelvey y Palfrey definieron el equilibrio de respuesta cuántica del agente ( AQRE ). AQRE es algo análogo a la perfección en subjuegos . En un AQRE, cada jugador juega con algún error como en QRE. En un nodo de decisión dado, el jugador determina la recompensa esperada de cada acción al tratar a su yo futuro como un jugador independiente con una distribución de probabilidad conocida sobre las acciones. Como en QRE, en AQRE cada estrategia se usa con probabilidad distinta de cero.
Aplicaciones
El enfoque de equilibrio de respuesta cuántica se ha aplicado en varios entornos. Por ejemplo, Goeree et al. (2002) estudian la sobreoferta en subastas de valor privado, [4] Yi (2005) explora el comportamiento en los juegos de ultimátum, [5] Hoppe y Schmitz (2013) estudian el papel de las preferencias sociales en los problemas principal-agente, [6] y Kawagoe et al. (2018) investigan juegos de bienes públicos escalonados con decisiones binarias. [7]
Críticas
No falsabilidad
El trabajo de Haile et al. ha demostrado que QRE no es falsable en ningún juego de forma normal, incluso con restricciones significativas a priori sobre las perturbaciones de pago. [8] Los autores argumentan que el concepto LQRE a veces puede restringir el conjunto de posibles resultados de un juego, pero puede ser insuficiente para proporcionar una prueba poderosa de comportamiento sin restricciones a priori sobre las perturbaciones de la recompensa.
Sin embargo, los autores dicen que "esto no debe confundirse con una crítica de la noción de QRE en sí. Más bien, nuestro objetivo ha sido aclarar algunas limitaciones de examinar el comportamiento un juego a la vez y desarrollar enfoques para una evaluación más informativa de QRE". Esta "no falsabilidad" es el resultado de mostrar distribuciones de probabilidad múltiples para las estrategias de los jugadores que pueden ser consistentes con los valores esperados de QRE, y que se necesitan más condiciones, como requerir perturbaciones independientes y distribuidas de manera idéntica, para garantizar una distribución de probabilidad única para el individuo. comportamiento como una distribución logit. Esto es esencialmente el mismo que el problema de refinamiento cuando ocurren múltiples equilibrios de Nash.
Pérdida de información
Al igual que en la mecánica estadística, el enfoque de campo medio, específicamente la expectativa en el exponente, da como resultado una pérdida de información. [9] De manera más general, las diferencias en el pago de un agente con respecto a su variable de estrategia dan como resultado una pérdida de información.
Ver también
Referencias
- ^ McKelvey, Richard ; Palfrey, Thomas (1995). "Equilibrios de respuesta cuántica para juegos de forma normal". Juegos y comportamiento económico . 10 : 6-38. CiteSeerX 10.1.1.30.5152 . doi : 10.1006 / juego.1995.1023 .
- ^ McKelvey, Richard ; Palfrey, Thomas (1998). "Equilibrios de respuesta cuántica para juegos de forma extensiva" (PDF) . Economía experimental . 1 : 9–41. doi : 10.1007 / BF01426213 .
- ^ Anderson, Simon P .; Goeree, Jacob K .; Holt, Charles A. (2004). "Aprendizaje direccional ruidoso y el equilibrio logit". La Revista Escandinava de Economía . 106 (3): 581–602. CiteSeerX 10.1.1.81.8574 . doi : 10.1111 / j.0347-0520.2004.00378.x .
- ^ Goeree, Jacob K .; Holt, Charles A .; Palfrey, Thomas R. (2002). "Equilibrio de respuesta cuántica y sobreoferta en subastas de valor privado" (PDF) . Revista de teoría económica . 104 (1): 247–272. doi : 10.1006 / jeth.2001.2914 . ISSN 0022-0531 .
- ^ Yi, Kang-Oh (2005). "Modelos de equilibrio de respuesta cuántica del juego de negociación del ultimátum". Juegos y comportamiento económico . 51 (2): 324–348. doi : 10.1016 / s0899-8256 (03) 00051-4 . ISSN 0899-8256 .
- ^ Hoppe, Eva I .; Schmitz, Patrick W. (2013). "Contratación bajo información incompleta y preferencias sociales: un estudio experimental" . Revisión de estudios económicos . 80 (4): 1516-1544. doi : 10.1093 / restud / rdt010 .
- ^ Kawagoe, Toshiji; Matsubae, Taisuke; Takizawa, Hirokazu (2018). "Equilibrios de respuesta cuántica en un dilema del voluntario generalizado y juegos de bienes públicos escalonados con decisión binaria". Revista de Economía Evolutiva e Institucional . 15 (1): 11-23. doi : 10.1007 / s40844-017-0081-6 . ISSN 1349-4961 .
- ^ Haile, Philip A .; Hortaçsu, Ali ; Kosenok, Grigory (2008). "Sobre el contenido empírico del equilibrio de respuesta cuántica". American Economic Review . 98 (1): 180–200. CiteSeerX 10.1.1.193.7715 . doi : 10.1257 / aer.98.1.180 .
- ^ Jessie, Daniel T .; Saari, Donald G. (2016). "Desde el axioma de elección de Luce al equilibrio de respuesta cuántica". Revista de Psicología Matemática . 75 : 3-9.