David Silver FRS (nacido en 1976) dirige el grupo de investigación de aprendizaje por refuerzo en DeepMind y fue investigador principal de AlphaGo , AlphaZero y codirector de AlphaStar .
Se graduó de la Universidad de Cambridge en 1997 con el premio Addison-Wesley y se hizo amigo de Demis Hassabis mientras estuvo allí. [1] Posteriormente, Silver cofundó la empresa de videojuegos Elixir Studios , donde fue director de tecnología y programador principal, recibiendo varios premios por tecnología e innovación. [1] [2]
Silver regresó a la academia en 2004 en la Universidad de Alberta para estudiar un doctorado en aprendizaje reforzado, donde co-introdujo los algoritmos utilizados en los primeros programas de nivel de maestría 9 × 9 Go. [3] [4] Su versión del programa MoGo (en coautoría con Sylvain Gelly) fue uno de los programas Go más sólidos en 2009. [5]
Silver recibió una beca de investigación de la Royal Society University en 2011 y, posteriormente, se convirtió en profesor en el University College de Londres , donde ahora es profesor. [6] Sus conferencias sobre aprendizaje reforzado están disponibles en YouTube. [7] Silver fue consultor de DeepMind desde sus inicios y se incorporó a tiempo completo en 2013.
Su trabajo reciente se ha centrado en combinar el aprendizaje por refuerzo con el aprendizaje profundo , incluido un programa que aprende a jugar juegos de Atari directamente desde píxeles. [8] Silver lideró el proyecto AlphaGo, que culminó con el primer programa para derrotar a un jugador profesional de primer nivel en el juego de tamaño completo de Go. [9] AlphaGo recibió posteriormente una certificación profesional honoraria de 9 Dan; y ganó el premio Cannes Lion a la innovación. [10] Luego dirigió el desarrollo de AlphaZero , que usó la misma IA para aprender a jugar Go desde cero (aprendiendo solo jugando a sí mismo y no a partir de juegos humanos) antes de aprender a jugar al ajedrez y al shogi de la misma manera, a niveles más altos que cualquier otro programa informático.
Silver se encuentra entre los miembros del personal más publicados en DeepMind, con más de 67.000 citas y tiene un índice h de 66. [11]
Fue galardonado con el Premio ACM de Computación 2019 por los avances revolucionarios en los juegos de computadora. [12]
En 2021, Silver fue elegido miembro de la Royal Society por sus contribuciones a Deep Q-Networks y AlphaGo . [13]
Referencias
- ^ a b Shead, Sam. "David Silver: el héroe anónimo y la potencia intelectual de Google DeepMind" . Business Insider . Consultado el 26 de septiembre de 2020 .
- ^ "Lo que la IA detrás de AlphaGo puede enseñarnos sobre ser humanos" . Wired.com . Consultado el 17 de mayo de 2016 .
- ^ David, Plata (2009). "Aprendizaje por refuerzo y búsqueda basada en simulación en Computer Go" . ERA . doi : 10.7939 / R39D8T .
- ^ Sylvain Gelly, David Silver (2008). "Lograr el nivel de juego maestro en 9 × 9 Computer Go" (PDF) . Actas de la XXIII Conferencia AAAI sobre Inteligencia Artificial .Mantenimiento de CS1: utiliza el parámetro de autores ( enlace )
- ^ Stuart J. Russell , Peter Norvig (2009). Inteligencia artificial: un enfoque moderno (3ª ed.). Prentice Hall .Mantenimiento de CS1: utiliza el parámetro de autores ( enlace )
- ^ "CSML | David Silver" . www.csml.ucl.ac.uk . Consultado el 27 de mayo de 2017 .
- ^ "Curso de RL por David Silver - Clase 1: Introducción al aprendizaje por refuerzo" . 13 de mayo de 2015 - a través de YouTube .
- ^ Mnih, Volodymyr; Kavukcuoglu, Koray; Silver, David; Rusu, Andrei A .; Veness, Joel; Bellemare, Marc G .; Graves, Alex; Riedmiller, Martin; Fidjeland, Andreas K. (26 de febrero de 2015). "Control a nivel humano a través del aprendizaje por refuerzo profundo". Naturaleza . 518 (7540): 529–533. Código Bib : 2015Natur.518..529M . doi : 10.1038 / nature14236 . ISSN 0028-0836 . PMID 25719670 . S2CID 205242740 .
- ^ Silver, David; Huang, Aja ; Maddison, Chris J .; Guez, Arthur; Sifre, Laurent; Driessche, George van den; Schrittwieser, Julian; Antonoglou, Ioannis; Panneershelvam, Veda; Lanctot, Marc; Dieleman, Sander; Grewe, Dominik; Nham, John; Kalchbrenner, Nal; Sutskever, Ilya ; Lillicrap, Timothy; Leach, Madeleine; Kavukcuoglu, Koray; Graepel, Thore; Hassabis, Demis (28 de enero de 2016). "Dominar el juego de Go con redes neuronales profundas y búsqueda de árboles". Naturaleza . 529 (7587): 484–489. Código Bibliográfico : 2016Natur.529..484S . doi : 10.1038 / nature16961 . ISSN 0028-0836 . PMID 26819042 . S2CID 515925 .
- ^ "Google DeepMind AlphaGo en Reino Unido gana el Gran Premio de Innovación" . Consultado el 27 de mayo de 2017 .
- ^ "David Silver - Citas de Google Académico" . Consultado el 1 de marzo de 2021 .
- ^ Ormond, Jim. "Premio ACM en Informática Otorgado al Desarrollador AlphaGo: David Silver Reconocido por Avances en Juegos de Computadora" . acm.org . Consultado el 2 de abril de 2020 .
- ^ "La Royal Society elige nuevos becarios y miembros extranjeros destacados" . royalsociety.org . Consultado el 8 de junio de 2021 .