AlphaGo


AlphaGo es un programa de computadora que juega el juego de mesa Go . [1] Fue desarrollado por DeepMind Technologies [2] una subsidiaria de Google (ahora Alphabet Inc. ). Las versiones posteriores de AlphaGo se volvieron cada vez más poderosas, incluida una versión que compitió bajo el nombre de Master . [3] Después de retirarse del juego competitivo, AlphaGo Master fue reemplazado por una versión aún más poderosa conocida como AlphaGo Zero , que fue completamente autodidacta sin aprender de los juegos humanos. AlphaGo Zero luego se generalizó en un programa conocido comoAlphaZero , que jugó juegos adicionales, incluidos el ajedrez y el shogi . AlphaZero, a su vez, ha sido reemplazado por un programa conocido como MuZero que aprende sin que le enseñen las reglas.

AlphaGo y sus sucesores utilizan un algoritmo de búsqueda de árbol de Monte Carlo para encontrar sus movimientos en función del conocimiento adquirido previamente mediante el aprendizaje automático , específicamente mediante una red neuronal artificial (un método de aprendizaje profundo ) mediante una amplia capacitación, tanto del juego humano como de la computadora. [4] Se entrena una red neuronal para identificar los mejores movimientos y los porcentajes ganadores de estos movimientos. Esta red neuronal mejora la fuerza de la búsqueda del árbol, lo que da como resultado una selección de movimiento más fuerte en la siguiente iteración.

En octubre de 2015, en un partido contra Fan Hui , el AlphaGo original se convirtió en el primer programa Go de computadora en vencer a un jugador humano profesional de Go sin discapacidad en un tablero de tamaño completo de 19 × 19. [5] [6] En marzo de 2016, venció a Lee Sedol en un partido de cinco juegos , la primera vez que un programa de computadora Go venció a un profesional de 9 dan sin discapacidad. [7] Aunque perdió ante Lee Sedol en el cuarto juego, Lee renunció en el juego final, dando un puntaje final de 4 juegos a 1 a favor de AlphaGo. En reconocimiento a la victoria, AlphaGo recibió un 9-dan honorífico de la Asociación Baduk de Corea.. [8] La preparación y el desafío con Lee Sedol se documentaron en un documental también titulado AlphaGo , [9] dirigido por Greg Kohs. La victoria de AlphaGo fue elegida por Science como uno de los subcampeones de Avance del año el 22 de diciembre de 2016. [10]

En la cumbre Future of Go de 2017 , la versión Master de AlphaGo venció a Ke Jie , el jugador número uno del mundo en ese momento, en una partida de tres juegos , después de lo cual AlphaGo recibió el premio profesional 9-dan de la Asociación Weiqi de China. . [11]

Después del partido entre AlphaGo y Ke Jie, DeepMind retiró AlphaGo, mientras continuaba con la investigación de IA en otras áreas. [12] El AlphaGo Zero autodidacta logró una victoria de 100-0 contra la primera versión competitiva de AlphaGo, y su sucesor AlphaZero es considerado actualmente como el mejor jugador del mundo en Go. [13] [14]

Go se considera mucho más difícil de ganar para las computadoras que otros juegos como el ajedrez , porque su factor de ramificación mucho más grande hace que sea prohibitivamente difícil usar métodos tradicionales de IA como la poda alfa-beta , el recorrido de árboles y la búsqueda heurística . [5] [15]


Logotipo de AlphaGo