Libratus es un programa informático de inteligencia artificial diseñado para jugar al póquer , específicamente heads up no-limit Texas Hold 'em . Los creadores de Libratus pretenden que sea generalizable a otras aplicaciones no específicas de Poker. Fue desarrollado en la Universidad Carnegie Mellon, Pittsburgh.
Fondo
Si bien Libratus fue escrito desde cero, es el sucesor nominal de Claudico . Como su predecesor, su nombre es una expresión latina y significa 'equilibrado'.
Libratus se construyó con más de 15 millones de horas centrales de cómputo en comparación con los 2-3 millones de Claudico. Los cálculos se llevaron a cabo en la nueva supercomputadora 'Bridges' en el Pittsburgh Supercomputing Center . Según uno de los creadores de Libratus, el profesor Tuomas Sandholm, Libratus no tiene una estrategia incorporada fija, sino un algoritmo que calcula la estrategia. La técnica involucrada es una nueva variante de minimización del arrepentimiento contrafactual , [1] a saber, el método CFR + introducido en 2014 por Oskari Tammelin. [2] Además de CFR +, Libratus utilizó una nueva técnica que Sandholm y su estudiante de doctorado, Noam Brown, desarrollaron para el problema de resolución de finales. Su nuevo método elimina el estándar de facto anterior en la programación del póquer, llamado "mapeo de acciones".
Como Libratus juega solo contra otro ser humano o jugador de computadora, se aplican las reglas especiales de 'mano a mano' para Texas Hold 'em para dos jugadores.
Partido humanos contra IA 2017
Del 11 al 31 de enero de 2017, Libratus se enfrentó en un torneo a cuatro jugadores de póquer humanos de primera clase, [3] a saber, Jason Les, Dong Kim, Daniel McAulay y Jimmy Chou. Para obtener resultados de mayor significación estadística, se debían jugar 120.000 manos, un aumento del 50% en comparación con el torneo anterior que jugó Claudico en 2015. Para gestionar el volumen extra, se aumentó la duración del torneo de 13 a 20 días. .
Los cuatro jugadores se agruparon en dos subequipos de dos jugadores cada uno. Uno de los subequipos estaba jugando al aire libre, mientras que el otro subequipo estaba ubicado en una habitación separada apodada 'The Dungeon' donde no se permitían teléfonos móviles u otras comunicaciones externas. El subequipo de Dungeon obtuvo la misma secuencia de cartas que se repartieron al aire libre, excepto que los lados se cambiaron: los humanos de Dungeon obtuvieron las cartas que la IA obtuvo al aire libre y viceversa. Esta configuración estaba destinada a anular el efecto de la suerte de las cartas.
El premio en metálico de 200.000 dólares se compartió exclusivamente entre los jugadores humanos. Cada jugador recibió un mínimo de $ 20,000, y el resto se distribuyó en relación con su éxito jugando contra la IA. Como estaba escrito en las reglas del torneo de antemano, la IA en sí no recibió premios en efectivo a pesar de que ganó el torneo contra el equipo humano.
Durante el torneo, Libratus competía contra los jugadores durante los días. De la noche a la mañana estuvo perfeccionando su estrategia por sí solo analizando la jugabilidad anterior y los resultados del día, particularmente sus pérdidas. Por lo tanto, fue capaz de corregir continuamente las imperfecciones que el equipo humano había descubierto en su extenso análisis, lo que resultó en una carrera armamentista permanente entre los humanos y Libratus. Usó otros 4 millones de horas centrales en la supercomputadora Bridges para los propósitos de la competencia.
Fuerza de la IA
Libratus había estado liderando contra los jugadores humanos desde el primer día del torneo. El jugador Dong Kim fue citado sobre la fuerza de la IA de la siguiente manera: "No me di cuenta de lo bueno que era hasta hoy. Sentí que estaba jugando contra alguien que estaba haciendo trampa, como si pudiera ver mis cartas. No estoy acusando de hacer trampa. Fue así de bueno ". [4]
En el día 16 de la competencia, Libratus rompió la barrera de los $ 1,000,000 por primera vez. Al final de ese día, estaba por delante $ 1.194.402 en fichas contra el equipo humano. Al final de la competencia, Libratus se adelantó $ 1,766,250 en fichas y ganó rotundamente. Como la ciega grande en los partidos se fijó en $ 100, la tasa de ganancia de Libratus es equivalente a 14.7 ciegas grandes por cada 100 manos. Esto se considera una tasa de ganancias excepcionalmente alta en el póquer y es muy significativa desde el punto de vista estadístico. [5]
De los jugadores humanos, Dong Kim fue el primero, MacAulay el segundo, Jimmy Chou el tercero y Jason Les el cuarto.
Nombre | Rango | Resultados (en chips) |
---|---|---|
Dong Kim | 1 | - $ 85,649 |
Daniel MacAulay | 2 | - $ 277,657 |
Jimmy Chou | 3 | - $ 522,857 |
Jason Les | 4 | - $ 880,087 |
Total: | - $ 1,766,250 |
Otras posibles aplicaciones
Si bien la primera aplicación de Libratus fue jugar al póquer, sus diseñadores tienen una misión mucho más amplia en mente para la IA. [6] Los investigadores diseñaron la IA para poder aprender cualquier juego o situación en la que se disponga de información incompleta y los "oponentes" puedan estar ocultando información o incluso engañándose. Debido a esto, Sandholm y sus colegas proponen aplicar el sistema a otros problemas del mundo real también, incluida la ciberseguridad, las negociaciones comerciales o la planificación médica. [7]
Ver también
Referencias
- ^ Hsu, Jeremy (10 de enero de 2017). "Conoce a los nuevos profesionales del póquer humano desafiantes de la IA" . Espectro IEEE . Consultado el 15 de enero de 2017 .
- ^ Brown, Noam; Sandholm, Tuomas (2017). "Solución segura y anidada de finales para juegos de información imperfecta" (PDF) . Actas del taller de AAAI sobre póquer informático y juegos de información imperfecta .
- ^ Especia, Byron; Allen, Garrett (4 de enero de 2017). "Subiendo la apuesta: los mejores profesionales del póquer se enfrentan frente a la inteligencia artificial" . Universidad Carnegie Mellon . Consultado el 12 de enero de 2017 .
- ^ Metz, Cade (24 de enero de 2017). "La inteligencia artificial está a punto de conquistar el póquer, pero no sin ayuda humana" . Cableado . Consultado el 24 de enero de 2017 .
- ^ "La IA de Libratus Poker supera a los humanos por $ 1,76 millones; ¿se acerca el final?" . PokerListings . 30 de enero de 2017 . Consultado el 16 de marzo de 2018 .
- ^ Knight, Will (23 de enero de 2017). "Por qué es tan importante que la IA sepa cómo farolear en el póquer" . Revisión de tecnología del MIT .
- ^ "La inteligencia artificial gana $ 800.000 contra 4 maestros del póquer" . Ingeniería interesante . 27 de enero de 2017.
enlaces externos
- Sitio web oficial de Brains versus Artificial Intelligence en el Rivers Casino