Equilibrio de respuesta cuántica

El equilibrio de respuesta cuántica ( QRE ) es un concepto de solución en la teoría de juegos . Introducido por primera vez por Richard McKelvey y Thomas Palfrey , ^[1]^[2] proporciona una noción de equilibrio con racionalidad limitada . QRE no es un refinamiento de equilibrio y puede dar resultados significativamente diferentes del equilibrio de Nash . QRE solo se define para juegos con estrategias discretas, aunque existen análogos de estrategia continua.

Equilibrio de respuesta cuántica
Un concepto de solución en la teoría de juegos
Relación
Superconjunto de	Equilibrio de Nash , equilibrio logit
Significado
Propuesto por	Richard McKelvey y Thomas Palfrey
Usado para	Juegos no cooperativos
Ejemplo	El dilema del viajero

En un equilibrio de respuesta cuántica, se supone que los jugadores cometen errores al elegir qué estrategia pura jugar. La probabilidad de que se elija una estrategia en particular está relacionada positivamente con la recompensa de esa estrategia. En otras palabras, es poco probable que se produzcan errores muy costosos.

El equilibrio surge de la realización de creencias. Los pagos de un jugador se calculan en función de las creencias sobre la distribución de probabilidad de otros jugadores sobre las estrategias. En equilibrio, las creencias de un jugador son correctas.

Aplicación a los datos

Cuando se analizan datos del juego de juegos reales, particularmente de experimentos de laboratorio , particularmente de experimentos con el juego de monedas de un centavo , el equilibrio de Nash puede ser implacable. Cualquier movimiento que no sea de equilibrio puede parecer igualmente "incorrecto", pero de manera realista no debería usarse para rechazar una teoría. QRE permite que todas las estrategias se jueguen con una probabilidad distinta de cero, por lo que cualquier dato es posible (aunque no necesariamente razonable).

Equilibrio logit

La especificación más común para QRE es el equilibrio logit ( LQRE ). En un equilibrio logit, las estrategias del jugador se eligen de acuerdo con la distribución de probabilidad:

${\ Displaystyle P_ {ij} = {\ frac {\ exp (\ lambda EU_ {ij} (P _ {- i}))} {\ sum _ {k} {\ exp (\ lambda EU_ {ik} (P_ { -I}))}}}}$

${\ Displaystyle P_ {ij}}$ es la probabilidad de jugador ${\ Displaystyle i}$ elegir estrategia ${\ Displaystyle j}$ . ${\ Displaystyle EU_ {ij} (P _ {- i}))}$ es la utilidad esperada para el jugador ${\ Displaystyle i}$ de elegir estrategia ${\ Displaystyle j}$ bajo la creencia de que otros jugadores están jugando de acuerdo con la distribución de probabilidad ${\ Displaystyle P _ {- i}}$ . Tenga en cuenta que la densidad de "creencia" en la recompensa esperada en el lado derecho debe coincidir con la densidad de elección en el lado izquierdo. Por lo tanto, calcular las expectativas de cantidades observables, como la recompensa, la demanda, la producción, etc., requiere encontrar puntos fijos como en la teoría del campo medio . ^[3]

Para juegos dinámicos

Para juegos dinámicos ( forma extensiva ), McKelvey y Palfrey definieron el equilibrio de respuesta cuántica del agente ( AQRE ). AQRE es algo análogo a la perfección en subjuegos . En un AQRE, cada jugador juega con algún error como en QRE. En un nodo de decisión dado, el jugador determina la recompensa esperada de cada acción al tratar a su yo futuro como un jugador independiente con una distribución de probabilidad conocida sobre las acciones. Como en QRE, en AQRE cada estrategia se usa con probabilidad distinta de cero.

Aplicaciones

El enfoque de equilibrio de respuesta cuántica se ha aplicado en varios entornos. Por ejemplo, Goeree et al. (2002) estudian la sobreoferta en subastas de valor privado, ^[4] Yi (2005) explora el comportamiento en los juegos de ultimátum, ^[5] Hoppe y Schmitz (2013) estudian el papel de las preferencias sociales en los problemas principal-agente, ^[6] y Kawagoe et al. (2018) investigan juegos de bienes públicos escalonados con decisiones binarias. ^[7]

Críticas

No falsabilidad

El trabajo de Haile et al. ha demostrado que QRE no es falsable en ningún juego de forma normal, incluso con restricciones significativas a priori sobre las perturbaciones de pago. ^[8] Los autores argumentan que el concepto LQRE a veces puede restringir el conjunto de posibles resultados de un juego, pero puede ser insuficiente para proporcionar una prueba poderosa de comportamiento sin restricciones a priori sobre las perturbaciones de la recompensa.

Sin embargo, los autores dicen que "esto no debe confundirse con una crítica de la noción de QRE en sí. Más bien, nuestro objetivo ha sido aclarar algunas limitaciones de examinar el comportamiento un juego a la vez y desarrollar enfoques para una evaluación más informativa de QRE". Esta "no falsabilidad" es el resultado de mostrar distribuciones de probabilidad múltiples para las estrategias de los jugadores que pueden ser consistentes con los valores esperados de QRE, y que se necesitan más condiciones, como requerir perturbaciones independientes y distribuidas de manera idéntica, para garantizar una distribución de probabilidad única para el individuo. comportamiento como una distribución logit. Esto es esencialmente el mismo que el problema de refinamiento cuando ocurren múltiples equilibrios de Nash.

Pérdida de información

Al igual que en la mecánica estadística, el enfoque de campo medio, específicamente la expectativa en el exponente, da como resultado una pérdida de información. ^[9] De manera más general, las diferencias en el pago de un agente con respecto a su variable de estrategia dan como resultado una pérdida de información.

Ver también

Referencias

^ McKelvey, Richard ; Palfrey, Thomas (1995). "Equilibrios de respuesta cuántica para juegos de forma normal". Juegos y comportamiento económico . 10 : 6-38. CiteSeerX 10.1.1.30.5152 . doi : 10.1006 / juego.1995.1023 .
^ McKelvey, Richard ; Palfrey, Thomas (1998). "Equilibrios de respuesta cuántica para juegos de forma extensiva" (PDF) . Economía experimental . 1 : 9–41. doi : 10.1007 / BF01426213 .
^ Anderson, Simon P .; Goeree, Jacob K .; Holt, Charles A. (2004). "Aprendizaje direccional ruidoso y el equilibrio logit". La Revista Escandinava de Economía . 106 (3): 581–602. CiteSeerX 10.1.1.81.8574 . doi : 10.1111 / j.0347-0520.2004.00378.x .
^ Goeree, Jacob K .; Holt, Charles A .; Palfrey, Thomas R. (2002). "Equilibrio de respuesta cuántica y sobreoferta en subastas de valor privado" (PDF) . Revista de teoría económica . 104 (1): 247–272. doi : 10.1006 / jeth.2001.2914 . ISSN 0022-0531 .
^ Yi, Kang-Oh (2005). "Modelos de equilibrio de respuesta cuántica del juego de negociación del ultimátum". Juegos y comportamiento económico . 51 (2): 324–348. doi : 10.1016 / s0899-8256 (03) 00051-4 . ISSN 0899-8256 .
^ Hoppe, Eva I .; Schmitz, Patrick W. (2013). "Contratación bajo información incompleta y preferencias sociales: un estudio experimental" . Revisión de estudios económicos . 80 (4): 1516-1544. doi : 10.1093 / restud / rdt010 .
^ Kawagoe, Toshiji; Matsubae, Taisuke; Takizawa, Hirokazu (2018). "Equilibrios de respuesta cuántica en un dilema del voluntario generalizado y juegos de bienes públicos escalonados con decisión binaria". Revista de Economía Evolutiva e Institucional . 15 (1): 11-23. doi : 10.1007 / s40844-017-0081-6 . ISSN 1349-4961 .
^ Haile, Philip A .; Hortaçsu, Ali ; Kosenok, Grigory (2008). "Sobre el contenido empírico del equilibrio de respuesta cuántica". American Economic Review . 98 (1): 180–200. CiteSeerX 10.1.1.193.7715 . doi : 10.1257 / aer.98.1.180 .
^ Jessie, Daniel T .; Saari, Donald G. (2016). "Desde el axioma de elección de Luce al equilibrio de respuesta cuántica". Revista de Psicología Matemática . 75 : 3-9.

[MKP1-1] McKelvey, Richard ; Palfrey, Thomas (1995). "Equilibrios de respuesta cuántica para juegos de forma normal". Juegos y comportamiento económico . 10 : 6-38. CiteSeerX 10.1.1.30.5152 . doi : 10.1006 / juego.1995.1023 .

[MKP2-2] McKelvey, Richard ; Palfrey, Thomas (1998). "Equilibrios de respuesta cuántica para juegos de forma extensiva" (PDF) . Economía experimental . 1 : 9–41. doi : 10.1007 / BF01426213 .

[AGH-3] Anderson, Simon P .; Goeree, Jacob K .; Holt, Charles A. (2004). "Aprendizaje direccional ruidoso y el equilibrio logit". La Revista Escandinava de Economía . 106 (3): 581–602. CiteSeerX 10.1.1.81.8574 . doi : 10.1111 / j.0347-0520.2004.00378.x .

[4] Goeree, Jacob K .; Holt, Charles A .; Palfrey, Thomas R. (2002). "Equilibrio de respuesta cuántica y sobreoferta en subastas de valor privado" (PDF) . Revista de teoría económica . 104 (1): 247–272. doi : 10.1006 / jeth.2001.2914 . ISSN 0022-0531 .

[5] Yi, Kang-Oh (2005). "Modelos de equilibrio de respuesta cuántica del juego de negociación del ultimátum". Juegos y comportamiento económico . 51 (2): 324–348. doi : 10.1016 / s0899-8256 (03) 00051-4 . ISSN 0899-8256 .

[6] Hoppe, Eva I .; Schmitz, Patrick W. (2013). "Contratación bajo información incompleta y preferencias sociales: un estudio experimental" . Revisión de estudios económicos . 80 (4): 1516-1544. doi : 10.1093 / restud / rdt010 .

[7] Kawagoe, Toshiji; Matsubae, Taisuke; Takizawa, Hirokazu (2018). "Equilibrios de respuesta cuántica en un dilema del voluntario generalizado y juegos de bienes públicos escalonados con decisión binaria". Revista de Economía Evolutiva e Institucional . 15 (1): 11-23. doi : 10.1007 / s40844-017-0081-6 . ISSN 1349-4961 .

[Haile-8] Haile, Philip A .; Hortaçsu, Ali ; Kosenok, Grigory (2008). "Sobre el contenido empírico del equilibrio de respuesta cuántica". American Economic Review . 98 (1): 180–200. CiteSeerX 10.1.1.193.7715 . doi : 10.1257 / aer.98.1.180 .

[JS-9] Jessie, Daniel T .; Saari, Donald G. (2016). "Desde el axioma de elección de Luce al equilibrio de respuesta cuántica". Revista de Psicología Matemática . 75 : 3-9.

[1]