David Silver (científico informático)

David Silver FRS (nacido en 1976) dirige el grupo de investigación de aprendizaje por refuerzo en DeepMind y fue investigador principal de AlphaGo , AlphaZero y codirector de AlphaStar .

Se graduó de la Universidad de Cambridge en 1997 con el premio Addison-Wesley y se hizo amigo de Demis Hassabis mientras estuvo allí. ^[1] Posteriormente, Silver cofundó la empresa de videojuegos Elixir Studios , donde fue director de tecnología y programador principal, recibiendo varios premios por tecnología e innovación. ^[1]^[2]

Silver regresó a la academia en 2004 en la Universidad de Alberta para estudiar un doctorado en aprendizaje reforzado, donde co-introdujo los algoritmos utilizados en los primeros programas de nivel de maestría 9 × 9 Go. ^[3]^[4] Su versión del programa MoGo (en coautoría con Sylvain Gelly) fue uno de los programas Go más sólidos en 2009. ^[5]

Silver recibió una beca de investigación de la Royal Society University en 2011 y, posteriormente, se convirtió en profesor en el University College de Londres , donde ahora es profesor. ^[6] Sus conferencias sobre aprendizaje reforzado están disponibles en YouTube. ^[7] Silver fue consultor de DeepMind desde sus inicios y se incorporó a tiempo completo en 2013.

Su trabajo reciente se ha centrado en combinar el aprendizaje por refuerzo con el aprendizaje profundo , incluido un programa que aprende a jugar juegos de Atari directamente desde píxeles. ^[8] Silver lideró el proyecto AlphaGo, que culminó con el primer programa para derrotar a un jugador profesional de primer nivel en el juego de tamaño completo de Go. ^[9] AlphaGo recibió posteriormente una certificación profesional honoraria de 9 Dan; y ganó el premio Cannes Lion a la innovación. ^[10] Luego dirigió el desarrollo de AlphaZero , que usó la misma IA para aprender a jugar Go desde cero (aprendiendo solo jugando a sí mismo y no a partir de juegos humanos) antes de aprender a jugar al ajedrez y al shogi de la misma manera, a niveles más altos que cualquier otro programa informático.

Silver se encuentra entre los miembros del personal más publicados en DeepMind, con más de 67.000 citas y tiene un índice h de 66. ^[11]

Fue galardonado con el Premio ACM de Computación 2019 por los avances revolucionarios en los juegos de computadora. ^[12]

En 2021, Silver fue elegido miembro de la Royal Society por sus contribuciones a Deep Q-Networks y AlphaGo . ^[13]

Referencias

^ ^a ^b Shead, Sam. "David Silver: el héroe anónimo y la potencia intelectual de Google DeepMind" . Business Insider . Consultado el 26 de septiembre de 2020 .
^ "Lo que la IA detrás de AlphaGo puede enseñarnos sobre ser humanos" . Wired.com . Consultado el 17 de mayo de 2016 .
^ David, Plata (2009). "Aprendizaje por refuerzo y búsqueda basada en simulación en Computer Go" . ERA . doi : 10.7939 / R39D8T .
^ Sylvain Gelly, David Silver (2008). "Lograr el nivel de juego maestro en 9 × 9 Computer Go" (PDF) . Actas de la XXIII Conferencia AAAI sobre Inteligencia Artificial .Mantenimiento de CS1: utiliza el parámetro de autores ( enlace )
^ Stuart J. Russell , Peter Norvig (2009). Inteligencia artificial: un enfoque moderno (3ª ed.). Prentice Hall .Mantenimiento de CS1: utiliza el parámetro de autores ( enlace )
^ "CSML | David Silver" . www.csml.ucl.ac.uk . Consultado el 27 de mayo de 2017 .
^ "Curso de RL por David Silver - Clase 1: Introducción al aprendizaje por refuerzo" . 13 de mayo de 2015 - a través de YouTube .
^ Mnih, Volodymyr; Kavukcuoglu, Koray; Silver, David; Rusu, Andrei A .; Veness, Joel; Bellemare, Marc G .; Graves, Alex; Riedmiller, Martin; Fidjeland, Andreas K. (26 de febrero de 2015). "Control a nivel humano a través del aprendizaje por refuerzo profundo". Naturaleza . 518 (7540): 529–533. Código Bib : 2015Natur.518..529M . doi : 10.1038 / nature14236 . ISSN 0028-0836 . PMID 25719670 . S2CID 205242740 .
^ Silver, David; Huang, Aja ; Maddison, Chris J .; Guez, Arthur; Sifre, Laurent; Driessche, George van den; Schrittwieser, Julian; Antonoglou, Ioannis; Panneershelvam, Veda; Lanctot, Marc; Dieleman, Sander; Grewe, Dominik; Nham, John; Kalchbrenner, Nal; Sutskever, Ilya ; Lillicrap, Timothy; Leach, Madeleine; Kavukcuoglu, Koray; Graepel, Thore; Hassabis, Demis (28 de enero de 2016). "Dominar el juego de Go con redes neuronales profundas y búsqueda de árboles". Naturaleza . 529 (7587): 484–489. Código Bibliográfico : 2016Natur.529..484S . doi : 10.1038 / nature16961 . ISSN 0028-0836 . PMID 26819042 . S2CID 515925 .
^ "Google DeepMind AlphaGo en Reino Unido gana el Gran Premio de Innovación" . Consultado el 27 de mayo de 2017 .
^ "David Silver - Citas de Google Académico" . Consultado el 1 de marzo de 2021 .
^ Ormond, Jim. "Premio ACM en Informática Otorgado al Desarrollador AlphaGo: David Silver Reconocido por Avances en Juegos de Computadora" . acm.org . Consultado el 2 de abril de 2020 .
^ "La Royal Society elige nuevos becarios y miembros extranjeros destacados" . royalsociety.org . Consultado el 8 de junio de 2021 .

Este artículo biográfico relacionado con un especialista en informática es un esbozo . Puedes ayudar a Wikipedia expandiéndolo .

[Unsung_Hero-1] Shead, Sam. "David Silver: el héroe anónimo y la potencia intelectual de Google DeepMind" . Business Insider . Consultado el 26 de septiembre de 2020 .

[MyUser_Wired.com_May_17_2016c-2] "Lo que la IA detrás de AlphaGo puede enseñarnos sobre ser humanos" . Wired.com . Consultado el 17 de mayo de 2016 .

[3] David, Plata (2009). "Aprendizaje por refuerzo y búsqueda basada en simulación en Computer Go" . ERA . doi : 10.7939 / R39D8T .

[4] Sylvain Gelly, David Silver (2008). "Lograr el nivel de juego maestro en 9 × 9 Computer Go" (PDF) . Actas de la XXIII Conferencia AAAI sobre Inteligencia Artificial .Mantenimiento de CS1: utiliza el parámetro de autores ( enlace )

[5] Stuart J. Russell , Peter Norvig (2009). Inteligencia artificial: un enfoque moderno (3ª ed.). Prentice Hall .Mantenimiento de CS1: utiliza el parámetro de autores ( enlace )

[6] "CSML | David Silver" . www.csml.ucl.ac.uk . Consultado el 27 de mayo de 2017 .

[7] "Curso de RL por David Silver - Clase 1: Introducción al aprendizaje por refuerzo" . 13 de mayo de 2015 - a través de YouTube .

[8] Mnih, Volodymyr; Kavukcuoglu, Koray; Silver, David; Rusu, Andrei A .; Veness, Joel; Bellemare, Marc G .; Graves, Alex; Riedmiller, Martin; Fidjeland, Andreas K. (26 de febrero de 2015). "Control a nivel humano a través del aprendizaje por refuerzo profundo". Naturaleza . 518 (7540): 529–533. Código Bib : 2015Natur.518..529M . doi : 10.1038 / nature14236 . ISSN 0028-0836 . PMID 25719670 . S2CID 205242740 .

[9] Silver, David; Huang, Aja ; Maddison, Chris J .; Guez, Arthur; Sifre, Laurent; Driessche, George van den; Schrittwieser, Julian; Antonoglou, Ioannis; Panneershelvam, Veda; Lanctot, Marc; Dieleman, Sander; Grewe, Dominik; Nham, John; Kalchbrenner, Nal; Sutskever, Ilya ; Lillicrap, Timothy; Leach, Madeleine; Kavukcuoglu, Koray; Graepel, Thore; Hassabis, Demis (28 de enero de 2016). "Dominar el juego de Go con redes neuronales profundas y búsqueda de árboles". Naturaleza . 529 (7587): 484–489. Código Bibliográfico : 2016Natur.529..484S . doi : 10.1038 / nature16961 . ISSN 0028-0836 . PMID 26819042 . S2CID 515925 .

[10] "Google DeepMind AlphaGo en Reino Unido gana el Gran Premio de Innovación" . Consultado el 27 de mayo de 2017 .

[MyUser_Https:_May_17_2016c-11] "David Silver - Citas de Google Académico" . Consultado el 1 de marzo de 2021 .

[12] Ormond, Jim. "Premio ACM en Informática Otorgado al Desarrollador AlphaGo: David Silver Reconocido por Avances en Juegos de Computadora" . acm.org . Consultado el 2 de abril de 2020 .

[13] "La Royal Society elige nuevos becarios y miembros extranjeros destacados" . royalsociety.org . Consultado el 8 de junio de 2021 .

[1]