AlphaGo es un programa de computadora que juega al juego de mesa Go . [1] Fue desarrollado por DeepMind Technologies [2] que luego fue adquirido por Google . Las versiones posteriores de AlphaGo se volvieron cada vez más poderosas, incluida una versión que compitió bajo el nombre de Master . [3] Después de retirarse del juego competitivo, AlphaGo Master fue sucedido por una versión aún más poderosa conocida como AlphaGo Zero , que fue completamente autodidacta sin aprender de los juegos humanos. AlphaGo Zero luego se generalizó en un programa conocido como AlphaZero, que jugó juegos adicionales, incluidos ajedrez y shogi . AlphaZero, a su vez, ha sido reemplazado por un programa conocido como MuZero que aprende sin que se le enseñen las reglas.
AlphaGo y sus sucesores utilizan un algoritmo de búsqueda de árboles de Monte Carlo para encontrar sus movimientos basados en el conocimiento previamente adquirido por el aprendizaje automático , específicamente por una red neuronal artificial (un método de aprendizaje profundo ) mediante un entrenamiento extenso, tanto del juego humano como de la computadora. [4] Se entrena una red neuronal para identificar los mejores movimientos y los porcentajes ganadores de estos movimientos. Esta red neuronal mejora la fuerza de la búsqueda del árbol, lo que resulta en una selección de movimientos más fuerte en la siguiente iteración.
En octubre de 2015, en un partido contra Fan Hui , el AlphaGo original se convirtió en el primer programa Go de computadora en vencer a un jugador de Go profesional humano sin desventaja en un tablero de 19 × 19 de tamaño completo. [5] [6] En marzo de 2016, venció a Lee Sedol en un partido de cinco juegos , la primera vez que un programa de computadora Go ha vencido a un profesional de 9 dan sin handicap. [7] Aunque perdió ante Lee Sedol en el cuarto juego, Lee renunció en el juego final, dando una puntuación final de 4 juegos a 1 a favor de AlphaGo. En reconocimiento a la victoria, AlphaGo recibió un 9-dan honorario de la Asociación Coreana de Baduk . [8] El inicio y el desafío con Lee Sedol fueron documentados en un documental también titulado AlphaGo , [9] dirigido por Greg Kohs. La victoria de AlphaGo fue elegida por Science como una de las finalistas de Avance del año el 22 de diciembre de 2016. [10]
En la Cumbre Future of Go 2017 , la versión Master de AlphaGo venció a Ke Jie , el jugador número uno del mundo en ese momento, en un partido de tres juegos , después de lo cual AlphaGo recibió un 9-dan profesional de la Asociación Weiqi de China. . [11]
Después del partido entre AlphaGo y Ke Jie, DeepMind retiró AlphaGo, mientras continuaba la investigación de IA en otras áreas. [12] El autodidacta AlphaGo Zero logró una victoria por 100-0 contra la primera versión competitiva de AlphaGo, y su sucesor AlphaZero es percibido actualmente como el mejor jugador del mundo en Go, así como posiblemente en ajedrez . [13] [14]
Historia
Go se considera mucho más difícil de ganar para las computadoras que otros juegos como el ajedrez , porque su factor de ramificación mucho mayor hace que sea prohibitivamente difícil usar métodos tradicionales de IA como poda alfa-beta , recorrido de árboles y búsqueda heurística . [5] [15]
Casi dos décadas después de que la computadora de IBM, Deep Blue, venciera al campeón mundial de ajedrez Garry Kasparov en el partido de 1997 , los programas de Go más fuertes que usaban técnicas de inteligencia artificial solo alcanzaron un nivel de 5 dan amateur , [4] y todavía no podían vencer a un jugador de Go profesional sin un discapacidad . [5] [6] [16] En 2012, el programa de software Zen , que se ejecuta en un grupo de cuatro PC, venció a Masaki Takemiya ( 9p ) dos veces en handicaps de cinco y cuatro piedras. [17] En 2013, Crazy Stone venció a Yoshio Ishida (9p) en un handicap de cuatro piedras. [18]
Según David Silver de DeepMind , el proyecto de investigación AlphaGo se formó alrededor de 2014 para probar qué tan bien una red neuronal que utiliza el aprendizaje profundo puede competir en Go. [19] AlphaGo representa una mejora significativa con respecto a los programas Go anteriores. En 500 juegos contra otros programas Go disponibles, incluidos Crazy Stone y Zen, AlphaGo ejecutándose en una sola computadora ganó todos menos uno. [20] En un enfrentamiento similar, AlphaGo ejecutándose en varias computadoras ganó los 500 juegos jugados contra otros programas Go, y el 77% de los juegos jugados contra AlphaGo ejecutándose en una sola computadora. La versión distribuida en octubre de 2015 usaba 1202 CPU y 176 GPU . [4]
Partido contra Fan Hui
En octubre de 2015, la versión distribuida de AlphaGo derrotó al campeón europeo de Go Fan Hui , [21] un profesional de 2 dan (de 9 dan posibles), cinco a cero. [6] [22] Esta fue la primera vez que un programa de computadora Go venció a un jugador humano profesional en un tablero de tamaño completo sin desventaja. [23] El anuncio de la noticia se retrasó hasta el 27 de enero de 2016 para coincidir con la publicación de un artículo en la revista Nature [4] que describe los algoritmos utilizados. [6]
Partido contra Lee Sedol
AlphaGo interpretó al jugador profesional surcoreano de Go Lee Sedol , clasificado 9-dan, uno de los mejores jugadores de Go, [16] [ necesita actualización ] con cinco juegos que se llevarán a cabo en el Four Seasons Hotel en Seúl , Corea del Sur el 9, 10, 12, 13 y 15 de marzo de 2016, [24] [25] que se transmitieron en video en vivo. [26] De cinco juegos, AlphaGo ganó cuatro juegos y Lee ganó el cuarto juego, lo que lo hizo registrado como el único jugador humano que venció a AlphaGo en todos sus 74 juegos oficiales. [27] AlphaGo se ejecutó en la computación en nube de Google con sus servidores ubicados en los Estados Unidos. [28] El partido usó reglas chinas con un komi de 7.5 puntos , y cada lado tuvo dos horas de tiempo para pensar más tres períodos byoyomi de 60 segundos . [29] La versión de AlphaGo jugando contra Lee usó una cantidad similar de poder de cómputo que se usó en el partido de Fan Hui. [30] The Economist informó que utilizaba 1.920 CPU y 280 GPU. [31] En el momento del juego, Lee Sedol tenía el segundo mayor número de victorias en el campeonato internacional de Go en el mundo después del jugador surcoreano Lee Changho, quien mantuvo el título del campeonato mundial durante 16 años. [32] Dado que no existe un método oficial único de clasificación en Go internacional , las clasificaciones pueden variar entre las fuentes. Si bien a veces ocupaba el primer lugar, algunas fuentes clasificaron a Lee Sedol como el cuarto mejor jugador del mundo en ese momento. [33] [34] AlphaGo no fue entrenado específicamente para enfrentar a Lee ni fue diseñado para competir con ningún jugador humano específico.
Los primeros tres juegos fueron ganados por AlphaGo luego de las renuncias de Lee. [35] [36] Sin embargo, Lee venció a AlphaGo en el cuarto juego, ganando por resignación en el movimiento 180. AlphaGo luego continuó logrando una cuarta victoria, ganando el quinto juego por resignación. [37]
El premio fue de 1 millón de dólares. Dado que AlphaGo ganó cuatro de cinco y, por lo tanto, la serie, el premio se donará a organizaciones benéficas, incluida UNICEF . [38] Lee Sedol recibió $ 150,000 por participar en los cinco juegos y $ 20,000 adicionales por su victoria en el Juego 4. [29]
En junio de 2016, en una presentación celebrada en una universidad de los Países Bajos, Aja Huang, uno del equipo de Deep Mind, reveló que habían reparado la debilidad lógica que se produjo durante el cuarto juego del partido entre AlphaGo y Lee, y que después la jugada 78 (que fue apodada la " jugada divina " por muchos profesionales), se jugaría según lo previsto y mantendría la ventaja de las negras. Antes del movimiento 78, AlphaGo lideraba durante todo el juego, pero el movimiento de Lee provocó que los poderes informáticos del programa se desviasen y confundieran. [39] Huang explicó que la red de políticas de AlphaGo de encontrar el orden de movimiento más preciso y la continuación no guió con precisión a AlphaGo a hacer la continuación correcta después del movimiento 78, ya que su red de valor no determinó que el movimiento 78 de Lee fuera el más probable y, por lo tanto, cuando se hizo el movimiento, AlphaGo no pudo hacer el ajuste correcto a la continuación lógica. [40]
Sesenta juegos online
El 29 de diciembre de 2016, una nueva cuenta en el servidor de Tygem llamada "Magister" (que se muestra como 'Magist' en la versión china del servidor) de Corea del Sur comenzó a jugar con jugadores profesionales. Cambió el nombre de su cuenta a "Master" el 30 de diciembre, luego se trasladó al servidor de FoxGo el 1 de enero de 2017. El 4 de enero, DeepMind confirmó que el "Magister" y el "Master" fueron reproducidos por una versión actualizada de AlphaGo. llamado AlphaGo Master . [41] [42] A partir del 5 de enero de 2017, el récord en línea de AlphaGo Master fue de 60 victorias y 0 derrotas, [43] incluidas tres victorias sobre el jugador mejor clasificado de Go, Ke Jie , [44] a quien se le había informado en silencio con anticipación que Master era una versión de AlphaGo. [43] Después de perder ante el Maestro, Gu Li ofreció una recompensa de 100.000 yuanes (14.400 dólares estadounidenses) al primer jugador humano que pudiera derrotar al Maestro. [42] Master jugó al ritmo de 10 juegos por día. Muchos sospecharon rápidamente que se trataba de un jugador de inteligencia artificial debido a que no descansaba o nada entre juegos. Entre sus adversarios se encontraban muchos campeones mundiales como Ke Jie , Park Jeong-hwan , Yuta Iyama , Tuo Jiaxi , Mi Yuting , Shi Yue , Chen Yaoye , Li Qincheng, Gu Li , Chang Hao , Tang Weixing, Fan Tingyu , Zhou Ruiyang , Jiang. Weijie , Chou Chun-hsun , Kim Ji-seok , Kang Dong-yun , Park Yeong-hun y Won Seong-jin ; campeones nacionales o subcampeones del campeonato mundial como Lian Xiao , Tan Xiao , Meng Tailing, Dang Yifei, Huang Yunsong, Yang Dingxin , Gu Zihao, Shin Jinseo, Cho Han-seung y An Sungjoon. Los 60 juegos excepto uno fueron juegos de ritmo rápido con tres byo-yomi de 20 o 30 segundos . El Maestro se ofreció a extender el byo-yomi a un minuto cuando jugaba con Nie Weiping en consideración a su edad. Después de ganar su 59º juego, Master se reveló en la sala de chat para ser controlado por el Dr. Aja Huang del equipo DeepMind, [45] luego cambió su nacionalidad al Reino Unido. Después de que se completaron estos juegos, el cofundador de Google DeepMind, Demis Hassabis , dijo en un tweet: "Estamos deseando jugar algunos juegos oficiales completos más adelante [2017] en colaboración con organizaciones y expertos de Go". [41] [42]
Los expertos en Go quedaron impresionados por el desempeño del programa y su estilo de juego no humano; Ke Jie declaró que "Después de que la humanidad pasó miles de años mejorando nuestras tácticas, las computadoras nos dicen que los humanos están completamente equivocados ... Yo iría tan lejos como para decir que ni un solo humano ha tocado el borde de la verdad de Go". [43]
Cumbre Future of Go
En la Cumbre Future of Go celebrada en Wuzhen en mayo de 2017, AlphaGo Master jugó tres juegos con Ke Jie, el jugador número uno del mundo, así como dos juegos con varios profesionales chinos de primer nivel, un juego de Go par y otro contra un colaborador equipo de cinco jugadores humanos. [46]
Google DeepMind ofreció premios ganadores de 1,5 millones de dólares por el partido de tres juegos entre Ke Jie y Master, mientras que el bando perdedor se llevó 300.000 dólares. [47] [48] Master ganó los tres juegos contra Ke Jie, [49] [50] después de lo cual AlphaGo recibió un 9-dan profesional de la Asociación Weiqi de China. [11]
Después de ganar su partido de tres juegos contra Ke Jie, el jugador mundial de Go mejor calificado, AlphaGo se retiró. DeepMind también disolvió el equipo que trabajó en el juego para centrarse en la investigación de IA en otras áreas. [12] Después de la Cumbre, Deepmind publicó 50 partidas completas de AlphaGo vs AlphaGo, como regalo para la comunidad de Go. [51]
AlphaGo Zero y AlphaZero
El equipo de AlphaGo publicó un artículo en la revista Nature el 19 de octubre de 2017, presentando AlphaGo Zero, una versión sin datos humanos y más fuerte que cualquier versión anterior que derrota a los campeones humanos. [52] Al jugar contra sí mismo, AlphaGo Zero superó la fuerza de AlphaGo Lee en tres días al ganar 100 juegos a 0, alcanzó el nivel de AlphaGo Master en 21 días y superó todas las versiones antiguas en 40 días. [53]
En un artículo publicado en arXiv el 5 de diciembre de 2017, DeepMind afirmó que generalizó el enfoque de AlphaGo Zero en un solo algoritmo AlphaZero, que logró en 24 horas un nivel de juego sobrehumano en las partidas de ajedrez , shogi y Go al derrotar al campeón mundial. programas, Stockfish , Elmo y la versión de 3 días de AlphaGo Zero en cada caso. [54]
Herramienta de enseñanza
El 11 de diciembre de 2017, DeepMind lanzó la herramienta de enseñanza AlphaGo en su sitio web [55] para analizar las tasas de ganancia de diferentes aperturas de Go calculadas por AlphaGo Master . [56] La herramienta de enseñanza recopila 6.000 aperturas de Go de 230.000 juegos humanos, cada uno analizado con 10.000.000 de simulaciones por AlphaGo Master. Muchas de las aperturas incluyen sugerencias de movimientos humanos. [56]
Versiones
Se probó una versión anterior de AlphaGo en hardware con varios números de CPU y GPU , ejecutándose en modo asíncrono o distribuido. A cada movimiento se le dieron dos segundos de tiempo para pensar. Las calificaciones Elo resultantes se enumeran a continuación. [4] En los partidos con más tiempo por jugada se consiguen puntuaciones más altas.
Configuración | Hilos de búsqueda | No de CPU | No. de GPU | Calificación Elo |
---|---|---|---|---|
Única [4] p. 10-11 | 40 | 48 | 1 | 2,181 |
Único | 40 | 48 | 2 | 2,738 |
Único | 40 | 48 | 4 | 2.850 |
Único | 40 | 48 | 8 | 2.890 |
Repartido | 12 | 428 | 64 | 2,937 |
Repartido | 24 | 764 | 112 | 3,079 |
Repartido | 40 | 1.202 | 176 | 3,140 |
Repartido | 64 | 1.920 | 280 | 3,168 |
En mayo de 2016, Google dio a conocer sus propias " unidades de procesamiento de tensores " de hardware patentado , que, según dijo, ya se habían implementado en múltiples proyectos internos en Google, incluido el partido AlphaGo contra Lee Sedol. [57] [58]
En la Cumbre Future of Go en mayo de 2017, DeepMind reveló que la versión de AlphaGo utilizada en esta Cumbre era AlphaGo Master , [59] [60] y reveló que había medido la fuerza de diferentes versiones del software. AlphaGo Lee, la versión usada contra Lee, podría darle a AlphaGo Fan, la versión usada en AlphaGo vs. Fan Hui, tres piedras, y AlphaGo Master era incluso tres piedras más fuerte. [61]
Versiones | Hardware | Calificación Elo | Fecha | Resultados |
---|---|---|---|---|
Ventilador AlphaGo | 176 GPU , [53] distribuidas | 3,144 [52] | Oct. De 2015 | 5: 0 contra Fan Hui |
AlphaGo Lee | 48 TPU , [53] distribuidos | 3.739 [52] | Mar. De 2016 | 4: 1 contra Lee Sedol |
Maestro AlphaGo | 4 TPU, [53] una sola máquina | 4.858 [52] | Mayo de 2017 | 60: 0 contra jugadores profesionales; Cumbre Future of Go |
AlphaGo Zero (bloque 40) | 4 TPU, [53] una sola máquina | 5.185 [52] | Oct. De 2017 | 100: 0 contra AlphaGo Lee 89:11 contra AlphaGo Master |
AlphaZero (bloque 20) | 4 TPU, una sola máquina | 5,018 [63] | Dic. De 2017 | 60:40 contra AlphaGo Zero (bloque 20) |
Algoritmo
A partir de 2016, el algoritmo de AlphaGo utiliza una combinación de aprendizaje automático y técnicas de búsqueda de árboles , combinadas con un entrenamiento extenso, tanto del juego humano como de la computadora. Utiliza la búsqueda de árbol de Monte Carlo , guiada por una "red de valor" y una "red de políticas", ambas implementadas utilizando tecnología de red neuronal profunda . [5] [4] Se aplica una cantidad limitada de preprocesamiento de detección de características específicas del juego (por ejemplo, para resaltar si un movimiento coincide con un patrón nakade ) a la entrada antes de enviarla a las redes neuronales. [4]
Las redes neuronales del sistema se basaron inicialmente en la experiencia del juego humano. AlphaGo fue entrenado inicialmente para imitar el juego humano al intentar igualar los movimientos de jugadores expertos de juegos históricos registrados, utilizando una base de datos de alrededor de 30 millones de movimientos. [21] Una vez que alcanzó un cierto grado de competencia, fue entrenado aún más al ser configurado para jugar una gran cantidad de juegos contra otras instancias de sí mismo, utilizando el aprendizaje por refuerzo para mejorar su juego. [5] Para evitar "irrespetuosamente" perder el tiempo de su oponente, el programa está específicamente programado para renunciar si su evaluación de la probabilidad de ganar cae por debajo de cierto umbral; para el partido contra Lee, el umbral de renuncia se fijó en 20%. [64]
Estilo de juego
Toby Manning, el árbitro del partido de AlphaGo contra Fan Hui, ha descrito el estilo del programa como "conservador". [65] El estilo de juego de AlphaGo favorece fuertemente una mayor probabilidad de ganar por menos puntos sobre una menor probabilidad de ganar por más puntos. [19] Su estrategia de maximizar su probabilidad de ganar es distinta de lo que los jugadores humanos tienden a hacer, que es maximizar las ganancias territoriales, y explica algunos de sus movimientos extraños. [66] Hace muchos movimientos de apertura que nunca o rara vez han sido realizados por humanos, mientras que evita muchos movimientos de apertura de segunda línea que a los jugadores humanos les gusta hacer. Le gusta usar golpes de hombro , especialmente si el oponente está demasiado concentrado. [ cita requerida ]
Respuestas a la victoria de 2016
Comunidad de IA
La victoria de AlphaGo en marzo de 2016 fue un hito importante en la investigación de inteligencia artificial. [67] Go se había considerado anteriormente como un problema difícil en el aprendizaje automático que se esperaba que estuviera fuera del alcance de la tecnología de la época. [67] [68] [69] La mayoría de los expertos pensaban que un programa Go tan poderoso como AlphaGo estaba al menos a cinco años de distancia; [70] Algunos expertos pensaron que tomaría al menos otra década antes de que las computadoras vencer a los campeones de Go. [4] [71] [72] La mayoría de los observadores al comienzo de los partidos de 2016 esperaban que Lee venciera a AlphaGo. [67]
Con juegos como las damas (que ha sido " resuelto " por el equipo de jugadores de Drafts de Chinook ), el ajedrez y ahora Go ganado por computadoras, las victorias en juegos de mesa populares ya no pueden servir como hitos importantes para la inteligencia artificial en la forma en que se usaba a. Deep Blue 's Murray Campbell llama la victoria de AlphaGo 'el fin de una era ... juegos de mesa son más o menos hecho y es hora de seguir adelante.' [67]
En comparación con Deep Blue o Watson , los algoritmos subyacentes de AlphaGo son potencialmente de uso más general y pueden ser una prueba de que la comunidad científica está avanzando hacia la inteligencia artificial general . [19] [73] Algunos comentaristas creen que la victoria de AlphaGo es una buena oportunidad para que la sociedad comience a prepararse para el posible impacto futuro de las máquinas con inteligencia de propósito general . Como señaló el empresario Guy Suter, AlphaGo solo sabe cómo jugar Go y no posee inteligencia de propósito general; "No podía simplemente despertarse una mañana y decidir que quiere aprender a usar armas de fuego". [67] El investigador de inteligencia artificial Stuart Russell dijo que los sistemas de inteligencia artificial como AlphaGo han progresado más rápido y se han vuelto más poderosos de lo esperado y, por lo tanto, debemos desarrollar métodos para garantizar que "permanezcan bajo el control humano". [74] Algunos académicos, como Stephen Hawking , advirtieron (en mayo de 2015 antes de los partidos) que alguna IA que se mejore a sí misma en el futuro podría obtener inteligencia general real, lo que provocaría una toma de control inesperada de la IA ; otros académicos no están de acuerdo: el experto en inteligencia artificial Jean-Gabriel Ganascia cree que "cosas como el ' sentido común ' ... puede que nunca sean reproducibles", [75] y dice: "No veo por qué hablaríamos de miedos. Al contrario, esto genera esperanzas en muchos dominios, como la salud y la exploración espacial ". [74] El científico informático Richard Sutton dijo: "No creo que la gente deba tener miedo ... pero sí creo que la gente debería prestar atención". [76]
En China, AlphaGo fue un " momento Sputnik " que ayudó a convencer al gobierno chino de priorizar y aumentar drásticamente la financiación para la inteligencia artificial. [77]
En 2017, el equipo de DeepMind AlphaGo recibió la medalla inaugural IJCAI Marvin Minsky por logros sobresalientes en IA. "AlphaGo es un logro maravilloso y un ejemplo perfecto de lo que se inició para reconocer la Medalla Minsky", dijo el profesor Michael Wooldridge , presidente del Comité de Premios IJCAI. "Lo que impresionó particularmente a IJCAI fue que AlphaGo logra lo que hace a través de una brillante combinación de técnicas clásicas de IA, así como las técnicas de aprendizaje automático de vanguardia con las que DeepMind está tan estrechamente asociado. Es una demostración impresionante de la IA contemporánea, y estamos encantados de poder reconocerlo con este premio ". [78]
Ir a la comunidad
Go es un juego popular en China, Japón y Corea, y los partidos de 2016 fueron vistos por quizás cien millones de personas en todo el mundo. [67] [79] Muchos de los mejores jugadores de Go caracterizaron las jugadas poco ortodoxas de AlphaGo como movimientos aparentemente cuestionables que inicialmente desconcertaron a los espectadores, pero que tenían sentido en retrospectiva: [71] "Todos menos los mejores jugadores de Go crean su estilo imitando a los mejores jugadores. AlphaGo parece tener movimientos totalmente originales que crea él mismo ". [67] AlphaGo parecía haberse vuelto inesperadamente mucho más fuerte, incluso en comparación con su partido de octubre de 2015 [80] donde una computadora había vencido a un profesional de Go por primera vez sin la ventaja de una desventaja. [81] El día después de la primera derrota de Lee, Jeong Ahram, el corresponsal principal en Go de uno de los diarios más importantes de Corea del Sur, dijo: "Anoche fue muy triste ... Mucha gente bebió alcohol". [82] La Asociación de Baduk de Corea , la organización que supervisa a los profesionales del Go en Corea del Sur, otorgó a AlphaGo un título honorario de 9 dan por exhibir habilidades creativas e impulsar el progreso del juego. [83]
Ke Jie de China , un joven de 18 años generalmente reconocido como el mejor jugador de Go del mundo en ese momento, [33] [84] inicialmente afirmó que podría vencer a AlphaGo, pero se negó a jugar contra él por temor a que lo hiciera. "copia mi estilo". [84] A medida que avanzaban los partidos, Ke Jie iba y venía, afirmando que "es muy probable que (pueda) perder" después de analizar los primeros tres partidos, [85] pero recuperando la confianza después de que AlphaGo mostró defectos en el cuarto partido. . [86]
Toby Manning, el árbitro del partido de AlphaGo contra Fan Hui, y Hajin Lee, secretario general de la Federación Internacional de Go , ambos razonan que en el futuro, los jugadores de Go recibirán ayuda de las computadoras para saber qué han hecho mal en los juegos y mejorar su rendimiento. habilidades. [81]
Después del segundo juego, Lee dijo que se sintió "sin palabras": "Desde el comienzo del partido, nunca pude manejar una ventaja para un solo movimiento. Fue la victoria total de AlphaGo". [87] Lee se disculpó por sus pérdidas, afirmando después del tercer juego que "juzgué mal las capacidades de AlphaGo y me sentí impotente". [67] Hizo hincapié en que la derrota fue "la derrota de Lee Se-dol" y "no una derrota de la humanidad". [27] [75] Lee dijo que su eventual pérdida a causa de una máquina era "inevitable", pero afirmó que "los robots nunca entenderán la belleza del juego de la misma manera que los humanos". [75] Lee calificó su victoria del cuarto juego como una "victoria invaluable que yo no cambiaría por nada". [27]
Sistemas similares
Facebook también ha estado trabajando en su propio sistema Go-playing, darkforest , también basado en la combinación del aprendizaje automático y la búsqueda de árboles de Monte Carlo . [65] [88] Aunque era un jugador fuerte contra otros programas de computadora Go, a principios de 2016, aún no había derrotado a un jugador humano profesional. [89] Darkforest ha perdido ante CrazyStone y Zen y se estima que tiene una fuerza similar a CrazyStone y Zen. [90]
DeepZenGo , un sistema desarrollado con el apoyo del sitio web de intercambio de videos Dwango y la Universidad de Tokio , perdió 2-1 en noviembre de 2016 ante el maestro de Go Cho Chikun , quien tiene el récord de la mayor cantidad de títulos de Go en Japón. [91] [92]
Un artículo de 2018 en Nature citó el enfoque de AlphaGo como la base para un nuevo medio de calcular posibles moléculas de fármacos farmacéuticos. [93]
Juego de ejemplo
AlphaGo Master (blanco) v. Tang Weixing (31 de diciembre de 2016), AlphaGo ganó por renuncia. White 36 fue ampliamente elogiado.
Primeros 99 movimientos |
Movimientos 100-186 (149 a 131, 150 a 130) |
Impactos en Go
La película documental de AlphaGo [94] [95] generó esperanzas de que Lee Sedol y Fan Hui se hubieran beneficiado de su experiencia de interpretar a AlphaGo, pero en mayo de 2018 sus índices de audiencia cambiaron poco; Lee Sedol ocupó el puesto 11 en el mundo y Fan Hui el 545. [96] El 19 de noviembre de 2019, Lee anunció su retiro del juego profesional, argumentando que nunca podría ser el mejor jugador de Go debido al creciente dominio de la IA. Lee se refirió a ellos como "una entidad que no puede ser derrotada". [97]
Ver también
- Chinook (jugador de draft) , programa de juego de draft
- Glosario de inteligencia artificial
- Ir y matemáticas
- Leela (software)
- TD-Gammon , red neuronal de backgammon
- Pluribus (robot de póquer)
- AlphaZero
- AlphaFold
Referencias
- ^ "Inteligencia artificial: AlphaGo de Google vence al maestro de Go Lee Se-dol" . BBC News . Consultado el 17 de marzo de 2016 .
- ^ "DeepMind AlphaGO" . DeepMind Inteligencia Artificial AlphaGo .
- ^ "AlphaGo | DeepMind" . DeepMind .
- ^ a b c d e f g h yo Silver, David ; Huang, Aja ; Maddison, Chris J .; Guez, Arthur; Sifre, Laurent; Driessche, George van den; Schrittwieser, Julian; Antonoglou, Ioannis; Panneershelvam, Veda; Lanctot, Marc; Dieleman, Sander; Grewe, Dominik; Nham, John; Kalchbrenner, Nal; Sutskever, Ilya ; Lillicrap, Timothy; Leach, Madeleine; Kavukcuoglu, Koray; Graepel, Thore; Hassabis, Demis (28 de enero de 2016). "Dominar el juego de Go con redes neuronales profundas y búsqueda de árboles". Naturaleza . 529 (7587): 484–489. Código Bibliográfico : 2016Natur.529..484S . doi : 10.1038 / nature16961 . ISSN 0028-0836 . PMID 26819042 . S2CID 515925 .
- ^ a b c d e "Blog de investigación: AlphaGo: Dominar el antiguo juego de Go con aprendizaje automático" . Blog de investigación de Google . 27 de enero de 2016.
- ^ a b c d "Google logra el 'avance' de la IA al vencer al campeón de Go" . BBC News . 27 de enero de 2016.
- ^ "Partido 1 - Partido desafío de Google DeepMind: Lee Sedol vs AlphaGo" . 8 de marzo de 2016.
- ^ "AlphaGo de Google obtiene el ranking Go 'divino'" . straitstimes.com . 15 de marzo de 2016 . Consultado el 9 de diciembre de 2017 .
- ^ "Película AlphaGo" .
- ^ "De la IA al plegamiento de proteínas: nuestros subcampeones de Breakthrough" . Ciencia . 22 de diciembre de 2016 . Consultado el 29 de diciembre de 2016 .
- ^ a b "中国 围棋 协会 授予 AlphaGo 职业 九段 并 颁发 证书" (en chino). Sohu.com . 27 de mayo de 2017 . Consultado el 9 de diciembre de 2017 .
- ^ a b "Después de ganar en China, los diseñadores de AlphaGo exploran nueva IA" . 27 de mayo de 2017.
- ^ "AlphaZero aplasta Stockfish en un nuevo partido de 1.000 juegos" . 17 de abril de 2019.
- ^ "Un algoritmo de aprendizaje por refuerzo general que domina el ajedrez, el shogi y Go a través del autojuego" . 7 de diciembre de 2018.
- ^ Schraudolph, Nicol N .; Terrence, Peter Dayan; Sejnowski, J., Aprendizaje de la diferencia temporal de la evaluación de la posición en el juego del go (PDF)
- ^ a b "La computadora obtiene una gran victoria contra los humanos en el antiguo juego de Go" . CNN. 28 de enero de 2016 . Consultado el 28 de enero de 2016 .
- ^ "¡El programa Zen Computer Go vence a Takemiya Masaki con solo 4 piedras!" . Vaya Gurú del juego . Archivado desde el original el 1 de febrero de 2016 . Consultado el 28 de enero de 2016 .
- ^ "「 ア マ 六段 の 力。 天才 か も 」囲 碁 棋士 、 コ ン ピ ュ ー タ ー に 敗 れ る 初 の 公式 戦" . Noticias de MSN Sankei. Archivado desde el original el 24 de marzo de 2013 . Consultado el 27 de marzo de 2013 .
- ^ a b c John Riberio (14 de marzo de 2016). "Los movimientos inusuales de AlphaGo demuestran su destreza en IA, dicen los expertos" . PC World . Consultado el 18 de marzo de 2016 .
- ^ "Google AlphaGo AI limpia arrasa campeón europeo de Go" . ZDNet . 28 de enero de 2016 . Consultado el 28 de enero de 2016 .
- ^ a b Metz, Cade (27 de enero de 2016). "En el gran avance de la IA, el sistema de Google vence secretamente al mejor jugador en el antiguo juego de Go" . CON CABLE . Consultado el 1 de febrero de 2016 .
- ^ "Inserto especial Computer Go que cubre el partido AlphaGo v Fan Hui" (PDF) . British Go Journal. 2017 . Consultado el 1 de febrero de 2016 .
- ^ "Première défaite d'un professionnel du go contre une intelligence artificielle" . Le Monde (en francés). 27 de enero de 2016.
- ^ "AI AlphaGo de Google para enfrentarse al número uno del mundo, Lee Sedol, en transmisión en vivo" . The Guardian . 5 de febrero de 2016 . Consultado el 15 de febrero de 2016 .
- ^ "Google DeepMind se enfrentará al mejor jugador de Go del mundo en un hotel de lujo de 5 estrellas en Corea del Sur" . Business Insider . 22 de febrero de 2016 . Consultado el 23 de febrero de 2016 .
- ^ Novet, Jordania (4 de febrero de 2016). "YouTube transmitirá en vivo la IA de Google interpretando a la superestrella de Go Lee Sedol en marzo" . VentureBeat . Consultado el 7 de febrero de 2016 .
- ^ a b c Yoon Sung-won (14 de marzo de 2016). "Lee Se-dol muestra a AlphaGo superable" . The Korea Times . Consultado el 15 de marzo de 2016 .
- ^ "李世 乭 : 即使 Alpha Go 得到 升级 也 一样 能赢" . JoongAng Ilbo (en chino). 23 de febrero de 2016 . Consultado el 24 de febrero de 2016 .
- ^ a b "이세돌 vs 알파 고, '구글 딥 마인드 챌린지 매치' 기자 회견 열려" (en coreano). Asociación Coreana de Baduk . 22 de febrero de 2016. Archivado desde el original el 3 de marzo de 2016 . Consultado el 22 de febrero de 2016 .
- ^ Demis Hassabis [@demishassabis] (11 de marzo de 2016). "Estamos usando aproximadamente la misma cantidad de potencia de cálculo que en la coincidencia de Fan Hui: distribuir la búsqueda entre otras máquinas tiene rendimientos decrecientes" (Tweet) . Consultado el 14 de marzo de 2016 , a través de Twitter .
- ^ "Enfrentamiento" . The Economist . Consultado el 19 de noviembre de 2016 .
- ^ Steven Borowiec (9 de marzo de 2016). "La máquina de inteligencia artificial de Google v campeón mundial de 'Go': todo lo que necesitas saber" . The Guardian . Consultado el 15 de marzo de 2016 .
- ^ a b Rémi Coulom . "Lista de clasificación de 2016-01-01" . Archivado desde el original el 18 de marzo de 2016 . Consultado el 18 de marzo de 2016 .
- ^ "El maestro de Go coreano demuestra que la intuición humana sigue siendo poderosa en Go" . The Korean Herald / ANN . 14 de marzo de 2016. Archivado desde el original el 12 de abril de 2016 . Consultado el 15 de marzo de 2016 .
- ^ "La IA de Google vence al campeón mundial de Go en el primero de cinco partidos - BBC News" . BBC Online . Consultado el 9 de marzo de 2016 .
- ^ "Google AI gana el segundo juego de Go contra el campeón mundial - BBC News" . BBC Online . Consultado el 10 de marzo de 2016 .
- ^ "Google DeepMind AI gana el último partido de Go para ganar la serie 4-1" . Engadget . Consultado el 15 de marzo de 2016 .
- ^ "Campeón humano seguro que vencerá a la IA en un antiguo juego chino" . Associated Press. 22 de febrero de 2016 . Consultado el 22 de febrero de 2016 .
- ^ "En dos movimientos, AlphaGo y Lee Sedol redefinieron el futuro" . CON CABLE . Consultado el 12 de noviembre de 2017 .
- ^ "黄士杰 : AlphaGo 李世石 人机 大战 第四局 问题 已 解决 fecha = 8 de julio de 2016" (en chino) . Consultado el 8 de julio de 2016 .
- ^ a b Demis Hassabis (4 de enero de 2017). "Demis Hassabis en Twitter:" ¡Encantado de compartir una actualización sobre #AlphaGo! " " . Cuenta de Twitter de Demis Hassabis . Consultado el 4 de enero de 2017 .
- ^ a b c Elizabeth Gibney (4 de enero de 2017). "Google revela una prueba secreta del bot de IA para vencer a los mejores jugadores de Go" . Naturaleza . 541 (7636): 142. Bibcode : 2017Natur.541..142G . doi : 10.1038 / nature.2017.21253 . PMID 28079098 . Consultado el 4 de enero de 2017 .
- ^ a b c "Los seres humanos lloran la pérdida después de que Google sea desenmascarado como Go Master de China" . Wall Street Journal . El 5 de enero de 2017 . Consultado el 6 de enero de 2017 .
- ^ "El mejor jugador de Go del mundo dice que todavía tiene" un último movimiento "para derrotar a AlphaGo AI de Google" . Cuarzo . 4 de enero de 2017 . Consultado el 6 de enero de 2017 .
- ^ "横扫 中 日韩 棋手 斩获 59 胜 的 Maestro 发话 : 我 是 阿尔法 狗" (en chino). 澎湃 新闻. 4 de enero de 2017 . Consultado el 11 de diciembre de 2017 .
- ^ "Explorando los misterios de Go con AlphaGo y los mejores jugadores de China" . 10 de abril de 2017.
- ^ "El jugador número uno del mundo, Ke Jie, se enfrentará a AlphaGo actualizado en mayo" . 10 de abril de 2017.
- ^ "Ke Jie vs AlphaGo: 8 cosas que debes saber" . 27 de mayo de 2017.
- ^ "AlphaGo renovado gana el primer juego contra el gran maestro chino de Go" . 23 de mayo de 2017.
- ^ "AlphaGo de Google continúa dominando con la segunda victoria en China" . 25 de mayo de 2017.
- ^ "Juegos completos para que disfruten los jugadores de Go" . Deepmind . Consultado el 28 de mayo de 2017 .
- ^ a b c d e Silver, David ; Schrittwieser, Julian; Simonyan, Karen; Antonoglou, Ioannis; Huang, Aja ; Guez, Arthur; Hubert, Thomas; Baker, Lucas; Lai, Matthew; Bolton, Adrian; Chen, Yutian ; Lillicrap, Timothy; Fan, Hui ; Sifre, Laurent; Driessche, George van den; Graepel, Thore; Hassabis, Demis (19 de octubre de 2017). "Dominar el juego de Go sin conocimiento humano" (PDF) . Naturaleza . 550 (7676): 354–359. Código Bib : 2017Natur.550..354S . doi : 10.1038 / nature24270 . ISSN 0028-0836 . PMID 29052630 . S2CID 205261034 .
- ^ a b c d e "AlphaGo Zero: Aprendiendo desde cero" . Sitio web oficial de DeepMind . 18 de octubre de 2017 . Consultado el 19 de octubre de 2017 .
- ^ Silver, David ; Hubert, Thomas; Schrittwieser, Julian; Antonoglou, Ioannis; Lai, Matthew; Guez, Arthur; Lanctot, Marc; Sifre, Laurent; Kumaran, Dharshan; Graepel, Thore; Lillicrap, Timothy; Simonyan, Karen; Hassabis, Demis (5 de diciembre de 2017). "Dominar el ajedrez y el shogi por auto-juego con un algoritmo de aprendizaje de refuerzo general". arXiv : 1712.01815 [ cs.AI ].
- ^ "Herramienta de enseñanza AlphaGo" . DeepMind .
- ^ a b "AlphaGo 教学 工具 上 线 樊 麾 : 使用 Master 版本" (en chino). Sina.com.cn . 11 de diciembre de 2017 . Consultado el 11 de diciembre de 2017 .
- ^ McMillan, Robert (18 de mayo de 2016). "Google no está jugando con un nuevo chip" . El Wall Street Journal . Consultado el 26 de junio de 2016 .
- ^ Jouppi, Norm (18 de mayo de 2016). "Google sobrealimenta las tareas de aprendizaje automático con un chip personalizado de TPU" . Blog de Google Cloud Platform . Consultado el 26 de junio de 2016 .
- ^ "AlphaGo 官方 解读 让 三 子 对 人类 高手 没 这种 优势" (en chino). Sina . 25 de mayo de 2017 . Consultado el 2 de junio de 2017 .
- ^ "各 版 alphago 实力 对比 master 能让 李世石 版 3 子" (en chino). Sina . 24 de mayo de 2017 . Consultado el 2 de junio de 2017 .
- ^ "Nueva versión de AlphaGo autodidacta y mucho más eficiente" . Asociación Estadounidense de Go . 24 de mayo de 2017 . Consultado el 1 de junio de 2017 .
- ^ "【柯 洁 战败 解密】 AlphaGo Master 最新 架构 和 算法 , 谷 歌 云 与 TPU 拆解" (en chino). Sohu . 24 de mayo de 2017 . Consultado el 1 de junio de 2017 .
- ^ "Material suplementario de papel AlphaZero Science, Data S1, figure1_elos.json, máximo elo logrado" .
- ^ Cade Metz (13 de marzo de 2016). "Go Grandmaster Lee Sedol agarra victoria de consolación contra la IA de Google" . Noticias por cable . Consultado el 29 de marzo de 2016 .
- ^ a b Gibney, Elizabeth (27 de enero de 2016). "El algoritmo de Google AI domina el antiguo juego de Go" . Naturaleza . 529 (7587): 445–6. Código Bibliográfico : 2016Natur.529..445G . doi : 10.1038 / 529445a . PMID 26819021 .
- ^ Chouard, Tanguy (12 de marzo de 2016). "Los archivos de Go: la computadora de AI logra la victoria contra el campeón de Go" . Naturaleza . doi : 10.1038 / nature.2016.19553 . S2CID 155164502 .
- ^ a b c d e f g h Steven Borowiec; Tracey Lien (12 de marzo de 2016). "AlphaGo vence al campeón de Go humano en un hito para la inteligencia artificial" . Los Angeles Times . Consultado el 13 de marzo de 2016 .
- ^ Connor, Steve (27 de enero de 2016). "Una computadora ha vencido a un profesional en el juego de mesa más complejo del mundo" . The Independent . Consultado el 28 de enero de 2016 .
- ^ "La IA de Google vence al campeón humano en Go" . CBC News . 27 de enero de 2016 . Consultado el 28 de enero de 2016 .
- ^ Dave Gershgorn (12 de marzo de 2016). "GOOGLE'S ALPHAGO GANA CAMPEÓN MUNDIAL EN TERCER PARTIDO PARA GANAR TODAS LAS SERIES" . Ciencia popular . Consultado el 13 de marzo de 2016 .
- ^ a b "Google DeepMind computadora AlphaGo arrasa campeón humano en partidos de Go" . CBC News . Prensa asociada . 12 de marzo de 2016 . Consultado el 13 de marzo de 2016 .
- ^ Sofia Yan (12 de marzo de 2016). "Una computadora de Google victoriosa sobre el campeón mundial de 'Go'" . CNN Money . Consultado el 13 de marzo de 2016 .
- ^ "AlphaGo: la inteligencia artificial de Google para enfrentarse al campeón mundial del antiguo juego de mesa chino" . Corporación Australiana de Radiodifusión . 8 de marzo de 2016 . Consultado el 13 de marzo de 2016 .
- ^ a b Mariëtte Le Roux (12 de marzo de 2016). "Rise of the Machines: Vigile la IA, advierten los expertos" . Phys.org . Consultado el 13 de marzo de 2016 .
- ^ a b c Mariëtte Le Roux; Pascale Mollard (8 de marzo de 2016). "¿Se acabó el juego? Nuevo desafío de IA para la inteligencia humana (Actualización)" . phys.org . Consultado el 13 de marzo de 2016 .
- ^ Tanya Lewis (11 de marzo de 2016). "Un experto en inteligencia artificial dice que al programa Go-playing de Google le falta una característica clave de la inteligencia humana" . Business Insider . Consultado el 13 de marzo de 2016 .
- ^ Mozur, Paul (20 de julio de 2017). "Beijing quiere que la inteligencia artificial se fabrique en China en 2030" . The New York Times . Consultado el 11 de abril de 2018 .
- ^ "Medalla Marvin Minsky por logros sobresalientes en IA" . Conferencia conjunta internacional sobre inteligencia artificial . 19 de octubre de 2017 . Consultado el 21 de octubre de 2017 .
- ^ CHOE SANG-HUN (16 de marzo de 2016). "Programa informático de Google vence a Lee Se-dol en el torneo Go" . The New York Times . Consultado el 18 de marzo de 2016 .
Más de 100 millones de personas vieron los partidos AlphaGo-Lee, dijo Hassabis.
- ^ John Ribeiro (12 de marzo de 2016). "El programa AlphaGo AI de Google es fuerte pero no perfecto, dice el jugador surcoreano derrotado de Go" . PC World . Consultado el 13 de marzo de 2016 .
- ^ a b Gibney, Elizabeth (2016). "Go jugadores reaccionan a la derrota de la computadora" . Naturaleza . doi : 10.1038 / nature.2016.19255 . S2CID 146868978 .
- ^ Zastrow, Mark (15 de marzo de 2016). "Cómo la victoria de Go AI de Google está avivando el miedo en Corea del Sur" . Nuevo científico . Consultado el 18 de marzo de 2016 .
- ^ JEE HEUN KAHNG; SE YOUNG LEE (15 de marzo de 2016). "El programa de inteligencia artificial de Google supera a S. Korean Go pro con una puntuación de 4-1" . Reuters . Consultado el 18 de marzo de 2016 .
- ^ a b Neil Connor (11 de marzo de 2016). "Google AlphaGo 'no puede vencerme', dice el gran maestro de China Go" . The Telegraph (Reino Unido) . Consultado el 13 de marzo de 2016 .
- ^ "El maestro chino de Go, Ke Jie, dice que podría perder ante AlphaGo: El DONG-A ILBO" . Consultado el 17 de marzo de 2016 .
- ^ "... si la actuación de hoy fue su verdadera capacidad, entonces no merece jugar contra mí" . M.hankooki.com. 14 de marzo de 2016 . Consultado el 5 de junio de 2018 .
- ^ CHOE SANG-HUN (15 de marzo de 2016). "En Seúl, Go Games despierta interés (y preocupación) sobre la inteligencia artificial" . The New York Times . Consultado el 18 de marzo de 2016 .
- ^ Tian, Yuandong; Zhu, Yan (2015). "Better Computer Go Player con red neuronal y predicción a largo plazo". arXiv : 1511.06410v1 [ cs.LG ].
- ^ HAL 90210 (28 de enero de 2016). "No Go: Facebook no estropea el gran día de la IA de Google" . The Guardian . ISSN 0261-3077 . Consultado el 1 de febrero de 2016 .
- ^ "Conferencia de Strachey - Dr. Demis Hassabis" . La nueva transmisión en vivo . Consultado el 17 de marzo de 2016 .
- ^ "Go master Cho gana la serie al mejor de tres contra la IA fabricada en Japón" . The Japan Times Online . 24 de noviembre de 2016 . Consultado el 27 de noviembre de 2016 .
- ^ "Los humanos contraatacan: el maestro de Go coreano supera a la IA en el combate del juego de mesa" . CNET . Consultado el 27 de noviembre de 2016 .
- ^ "Ve y haz algunas drogas El Ingeniero" . www.theengineer.co.uk . Consultado el 3 de abril de 2018 .
- ^ https://www.alphagomovie.com/
- ^ "AlphaGo (2017)" . Tomates podridos . Consultado el 5 de junio de 2018 .
- ^ "Ir a calificaciones" . Ir a Calificaciones . Consultado el 5 de junio de 2018 .
- ^ Vincent, James (27 de noviembre de 2019). "El ex campeón de Go derrotado por DeepMind se retira después de declarar a la IA invencible" . The Verge . Consultado el 28 de noviembre de 2019 .
enlaces externos
- Medios relacionados con AlphaGo en Wikimedia Commons
- Citas relacionadas con AlphaGo en Wikiquote
- Página web oficial
- Wiki de AlphaGo en la biblioteca de Sensei , que incluye enlaces a juegos de AlphaGo
- Página AlphaGo , con archivo y juegos
- Calificación estimada de 2017 de Alpha Go