Hanabi (juego de cartas)

Hanabi (del japonés 花火, fuegos artificiales) es un juego de cartas cooperativo creado por el diseñador de juegos francés Antoine Bauza y publicado en 2010 por Asmodée Éditions . ^[1] Los jugadores conocen las cartas de otros jugadores, pero no las suyas, e intentan jugar una serie de cartas en un orden específico para desencadenar unespectáculo de fuegos artificiales simulados. Los tipos de información que los jugadores pueden darse entre sí son limitados, al igual que la cantidad total de información que se puede dar durante el juego. En 2013, Hanabi ganó el Spiel des Jahres , un premio de la industria al mejor juego de mesa del año.

*Hanabi*
La tapa de la caja de Hanabi
Diseñada por	Antoine Bauza
Publicado por	Juegos de R&R , Juegos de cóctel , Abacus Spiele
Jugadores	2 hasta 5
Tiempo de preparación	5 minutos
Tiempo para jugar	20-30 minutos
Oportunidad aleatoria	Medio
Rango de edad	8 y más
Habilidades requeridas	Deducción , Memoria , Cooperación , Planificación

Como se Juega

El mazo de Hanabi contiene cartas de cinco palos (blanco, amarillo, verde, azul y rojo): tres unos, dos de dos, tres y cuatro de cada uno, y un 5. El juego comienza con 8 fichas de información disponibles y 3 fichas de fusible. . Para comenzar el juego, los jugadores reciben una mano que contiene cinco cartas (cuatro para 4 o 5 jugadores). Como en el póquer indio , los jugadores pueden ver las cartas de los demás, pero no pueden ver las suyas. El juego procede alrededor de la mesa; cada turno, un jugador debe realizar una de las siguientes acciones:

Dar información : El jugador señala las cartas de un número determinado o de un palo en la mano de otro jugador (ejemplos: "Esta carta es su única carta roja", "Estas dos cartas son sus únicos 3"). La información proporcionada debe ser completa y correcta. (En algunas ediciones, se permite indicar que un jugador tiene cero de algo; otras versiones prohíben explícitamente este caso). Dar información consume una ficha de información.
Descartar una carta : el jugador elige una carta de su mano y la agrega a la pila de descarte, luego roba una carta para reemplazarla. La carta descartada está fuera del juego y ya no se puede jugar. Descartar una carta repone una ficha de información.
Jugar una carta : el jugador elige una carta de su mano e intenta agregarla a las cartas ya jugadas. Esto tiene éxito si la carta es un 1 en un palo que aún no se ha jugado, o si es el siguiente número secuencialmente en un palo que se ha jugado. De lo contrario, se consume una ficha de fusible y se descarta la carta mal jugada. Jugar con éxito un 5 de cualquier palo repone una ficha de información. Ya sea que la jugada haya tenido éxito o no, el jugador roba una carta de reemplazo.

Los jugadores pierden de inmediato si se agotan todas las fichas de fusibles y ganan de inmediato si los 5 se han jugado con éxito. De lo contrario, el juego continúa hasta que el mazo se vacía y durante una ronda completa después de eso. Al final del juego, se suman los valores de las cartas más altas de cada palo, lo que da como resultado una puntuación total de 25 puntos posibles.

Premios

Ganador del Spiel des Jahres 2013 ^[2]
Ganador del premio Fairplay a la carta 2013 ^[3]

Computadora Hanabi

Hanabi es un juego cooperativo de información imperfecta .

Los programas de computadora que juegan con Hanabi pueden participar en "juegos individuales" o "juegos en equipo ad hoc". En el juego individual, varias instancias del programa se juegan entre sí en un equipo. Por lo tanto, comparten una estrategia cuidadosamente perfeccionada para la comunicación y el juego, aunque, por supuesto, no se les permite compartir ilegalmente ninguna información sobre cada juego con otras instancias del programa.

En el juego en equipo ad hoc, el programa juega con otros programas arbitrarios o jugadores humanos.

Se han desarrollado una variedad de programas de computadora mediante la codificación manual de estrategias basadas en reglas . Los mejores programas, como WTFWThat, lograron resultados casi perfectos en el juego personal con cinco jugadores, con una puntuación media de 24,9 sobre 25. ^[4]^[5]

Desafío de IA

En 2019, DeepMind propuso a Hanabi como un juego ideal con el que establecer un nuevo punto de referencia para la investigación de la inteligencia artificial en el juego cooperativo. ^[6]^[7]^[5]

En el modo de juego automático, el desafío es desarrollar un programa que pueda aprender desde cero a jugar bien con otras instancias de sí mismo. Dichos programas logran solo alrededor de 15 puntos por juego a partir de 2019, mucho peor que los programas codificados a mano. ^[5] Sin embargo, esta brecha se ha reducido significativamente a partir de 2020, con el Decodificador de Acción Simplificado logrando puntajes alrededor de 24. ^[8]

El juego en equipo ad hoc es un desafío mucho mayor para la IA, porque "Hanabi eleva el razonamiento sobre las creencias e intenciones de otros agentes a un primer plano". ^[5] Jugar a niveles humanos con equipos ad hoc requiere que los algoritmos aprendan y desarrollen convenciones y estrategias de comunicación a lo largo del tiempo con otros jugadores a través de una teoría de la mente . Los programas de computadora desarrollados para el auto-juego fallan mucho cuando se juega en equipos ad hoc, ya que no saben cómo aprender a adaptarse a la forma en que juegan otros jugadores. Hu y col. demostraron que el aprendizaje de estrategias invariantes de simetría ayuda a los agentes de IA a evitar el aprendizaje de convenciones no interpretables, mejorando su desempeño cuando se combinan con agentes de IA entrenados por separado (con una puntuación de alrededor de 22) y con humanos (con una puntuación de alrededor de 16 frente a un modelo de auto-juego de referencia que obtuvo una puntuación de alrededor de 9 ). ^[8]

Deepmind lanzó un marco de código fuente abierto para facilitar la investigación, llamado Hanabi Learning Environment . ^[9]

Ver también

Puente de computadora

Referencias

^ "Hanabi | Juego de mesa | BoardGameGeek" . boardgamegeek.com . Consultado el 24 de enero de 2016 .
^ "Sitio oficial de Spiel des Jahres: ganador de 2013" .
^ "Fairplay Online: premio a la carta 2013" . (en alemán)
^ Cox, Christopher; De Silva, Jessica; Deorsey, Philip; Kenter, Franklin HJ; Retter, Troy; Tobin, Josh (diciembre de 2014). "Cómo hacer la exhibición de fuegos artificiales perfecta: dos estrategias para Hanabi". Revista de Matemáticas . 88 (5): 323–336. doi : 10.4169 / math.mag.88.5.323 . ISSN 0025-570X . S2CID 124445429 .
^ a b c d Bolos, Michael; Bellemare, Marc G .; Larochelle, Hugo; Mourad, Shibl; Dunning, Iain; Hughes, Edward; Moitra, Subhodeep; Dumoulin, Vincent; Parisotto, Emilio (1 de febrero de 2019). "El desafío de Hanabi: una nueva frontera para la investigación de la IA". arXiv : 1902.00506v1 [ cs.LG ].
^ "El próximo gran desafío para la IA de Google es un juego de cartas del que nunca has oído hablar" . www.digitaltrends.com . Consultado el 4 de julio de 2019 .
^ "Un punto de referencia cooperativo: anunciando el entorno de aprendizaje de Hanabi" . www.marcgbellemare.info . Consultado el 4 de julio de 2019 .
^ a b Hu, Hengyuan; Lerer, Adam; Peysakhovich, Alex; Foerster, Jakob. " " Other-Play "para la coordinación Zero-Shot" (PDF) . Conferencia Internacional sobre Aprendizaje Automático, 2020.
^ hanabi_learning_environment es una plataforma de investigación para experimentos de Hanabi .: deepmind / hanabi-learning-environment , DeepMind, 2019-07-01 , consultado el 2019-07-04

enlaces externos

Hanabi en BoardGameGeek
Seagull, Jon (29 de septiembre de 2014). "Hanabi: juego de cartas con el objetivo de lanzar un espectacular castillo de fuegos artificiales" . Boing Boing . Consultado el 7 de junio de 2015 .
Hirotaka Osawa (1 de abril de 2015). "Resolver Hanabi: Estimación de manos por acciones del oponente en juego cooperativo con información incompleta" . www.aaai.org . Talleres AAAI en la Vigésimo Novena Conferencia AAAI sobre Inteligencia Artificial . Consultado el 7 de junio de 2015 .

[1] "Hanabi | Juego de mesa | BoardGameGeek" . boardgamegeek.com . Consultado el 24 de enero de 2016 .

[2] "Sitio oficial de Spiel des Jahres: ganador de 2013" .

[3] "Fairplay Online: premio a la carta 2013" . (en alemán)

[4] Cox, Christopher; De Silva, Jessica; Deorsey, Philip; Kenter, Franklin HJ; Retter, Troy; Tobin, Josh (diciembre de 2014). "Cómo hacer la exhibición de fuegos artificiales perfecta: dos estrategias para Hanabi". Revista de Matemáticas . 88 (5): 323–336. doi : 10.4169 / math.mag.88.5.323 . ISSN 0025-570X . S2CID 124445429 .

[:0-5] Bolos, Michael; Bellemare, Marc G .; Larochelle, Hugo; Mourad, Shibl; Dunning, Iain; Hughes, Edward; Moitra, Subhodeep; Dumoulin, Vincent; Parisotto, Emilio (1 de febrero de 2019). "El desafío de Hanabi: una nueva frontera para la investigación de la IA". arXiv : 1902.00506v1 [ cs.LG ].

[6] "El próximo gran desafío para la IA de Google es un juego de cartas del que nunca has oído hablar" . www.digitaltrends.com . Consultado el 4 de julio de 2019 .

[7] "Un punto de referencia cooperativo: anunciando el entorno de aprendizaje de Hanabi" . www.marcgbellemare.info . Consultado el 4 de julio de 2019 .

[otherplay-8] Hu, Hengyuan; Lerer, Adam; Peysakhovich, Alex; Foerster, Jakob. " " Other-Play "para la coordinación Zero-Shot" (PDF) . Conferencia Internacional sobre Aprendizaje Automático, 2020.

[9] _learning_environment es una plataforma de investigación para experimentos de Hanabi .: deepmind / hanabi-learning-environment , DeepMind, 2019-07-01 , consultado el 2019-07-04

[1]