Richard S. Sutton

Richard S. Sutton FRS es un informático canadiense . Actualmente, es un científico investigador distinguido en DeepMind y profesor de ciencias de la computación en la Universidad de Alberta . Sutton es considerado uno de los padres fundadores del aprendizaje por refuerzo computacional moderno , ^[1] con varias contribuciones significativas al campo, incluido el aprendizaje de diferencias temporales y métodos de gradiente de políticas.

Richard S. Sutton FRS

Nacionalidad	canadiense
Ciudadanía	canadiense
alma mater	Universidad de Massachusetts Amherst Stanford University
Conocido por	Aprendizaje de diferencia temporal , Dyna, Opciones, GQ (λ)
Premios	Miembro de la AAAI (2001) Premio del presidente (INNS) (2003) Miembro de la Royal Society of Canada (2016)
Carrera científica
Campos	Aprendizaje por refuerzo de inteligencia artificial
Instituciones	Universidad de Alberta
Tesis	Asignación de créditos temporales en el aprendizaje por refuerzo (1984)
Asesor de doctorado	Andrés Barto
Estudiantes de doctorado	David Silver , Precup de Doina

Sitio web	incompleteideas .net

Vida y educación

Richard Sutton nació en Ohio y creció en Oak Brook, Illinois , un suburbio de Chicago .

Sutton recibió su licenciatura en psicología de la Universidad de Stanford en 1978 antes de obtener una maestría (1980) y un doctorado. (1984) en ciencias de la computación de la Universidad de Massachusetts Amherst bajo la supervisión de Andrew Barto . Su tesis doctoral, Asignación de créditos temporales en el aprendizaje por refuerzo , introdujo arquitecturas de actor crítico y asignación de créditos temporales . ^[2]

Carrera profesional

En 1984, Sutton fue investigador postdoctoral en la Universidad de Massachusetts.

De 1985 a 1994, fue miembro principal del personal técnico en el Laboratorio de Computación y Sistemas Inteligentes en GTE en Waltham, Massachusetts . En 1995, regresó a la Universidad de Massachusetts como investigador científico senior.

De 1998 a 2002, Sutton trabajó en el Laboratorio AT&T Shannon en Florham Park, Nueva Jersey como miembro principal del personal técnico en el departamento de inteligencia artificial.

Desde 2003, ha sido profesor de ciencias de la computación en la Universidad de Alberta . Lideró el Laboratorio de Refuerzo de Aprendizaje e Inteligencia Artificial de la institución hasta 2018.

Mientras conservaba su cátedra, Sutton se unió a Deepmind en junio de 2017 como un científico investigador distinguido y cofundador de su nueva oficina en Edmonton . ^[2]^[3]

Sutton se convirtió en ciudadano canadiense en 2015 y renunció a su ciudadanía estadounidense en 2017.

Publicaciones Seleccionadas

Sutton, RS, Barto, AG, Aprendizaje por refuerzo: una introducción . MIT Press, 1998. También traducido al japonés y al ruso. Segunda edición MIT Press 2018.
Miller, WT, Sutton, RS, Werbos, PJ (Eds.), Redes neuronales para el control . Prensa del MIT, 1991.
Sutton, RS (Ed.), Aprendizaje por refuerzo. Reimpresión de un número especial de Machine Learning Journal. Prensa académica Kluwer, 1992

Premios y honores

Sutton es miembro de la Association for the Advancement of Artificial Intelligence (AAAI) desde 2001. ^[4] En 2003 recibió el President's Award de la International Neural Network Society ^[5] y en 2013, el premio Outstanding Achievement in Research de la Universidad de Massachusetts Amherst . ^[6]

La nominación de Sutton como miembro de AAAI dice: ^[4]

Para contribuciones significativas a muchos temas en el aprendizaje automático, incluido el aprendizaje por refuerzo, técnicas de diferencia temporal y redes neuronales.

En 2021, Sutton fue elegido miembro de la Royal Society. ^[7]

Referencias

^ "Exclusivo: entrevista con Rich Sutton, el padre del aprendizaje por refuerzo" . 2018-01-11. Archivado desde el original el 11 de enero de 2018 . Consultado el 17 de diciembre de 2018 .
^ a b "Breve biografía de Richard Sutton" . incompleteideas.net . Consultado el 17 de diciembre de 2018 .
^ "DeepMind se expande a Canadá con una nueva oficina de investigación en Edmonton, Alberta" . DeepMind . Consultado el 17 de diciembre de 2018 .
^ a b "Becarios electos de AAAI" . www.aaai.org . Consultado el 17 de diciembre de 2018 .
^ "Destinatarios del Premio INNS" . www.inns.org . Consultado el 17 de diciembre de 2018 .
^ "Destinatarios del premio al logro excepcional y promoción" . Facultad de Ciencias de la Información y la Computación, Universidad de Massachusetts Amherst . 2010-10-05 . Consultado el 17 de diciembre de 2018 .
^ "La Royal Society elige nuevos becarios y miembros extranjeros destacados" . royalsociety.org . Consultado el 8 de junio de 2021 .

enlaces externos

Página de Richard Sutton
Publicaciones de Richard S. Sutton indexadas por Google Scholar

[:0-1] "Exclusivo: entrevista con Rich Sutton, el padre del aprendizaje por refuerzo" . 2018-01-11. Archivado desde el original el 11 de enero de 2018 . Consultado el 17 de diciembre de 2018 .

[:2-2] "Breve biografía de Richard Sutton" . incompleteideas.net . Consultado el 17 de diciembre de 2018 .

[:1-3] "DeepMind se expande a Canadá con una nueva oficina de investigación en Edmonton, Alberta" . DeepMind . Consultado el 17 de diciembre de 2018 .

[:3-4] "Becarios electos de AAAI" . www.aaai.org . Consultado el 17 de diciembre de 2018 .

[5] "Destinatarios del Premio INNS" . www.inns.org . Consultado el 17 de diciembre de 2018 .

[6] "Destinatarios del premio al logro excepcional y promoción" . Facultad de Ciencias de la Información y la Computación, Universidad de Massachusetts Amherst . 2010-10-05 . Consultado el 17 de diciembre de 2018 .

[7] "La Royal Society elige nuevos becarios y miembros extranjeros destacados" . royalsociety.org . Consultado el 8 de junio de 2021 .

[1]