Jürgen Schmidhuber (nacido el 17 de enero de 1963) [1] es un científico informático más conocido por su trabajo en el campo de la inteligencia artificial , el aprendizaje profundo y las redes neuronales artificiales . Es codirector del Instituto Dalle Molle de Investigación en Inteligencia Artificial en Manno , en el distrito de Lugano , en Ticino, en el sur de Suiza. [2] A veces se le llama el "padre de la IA (moderna)". [3] [4] [5]
Jürgen Schmidhuber | |
---|---|
Nació | 17 de enero de 1963 [1] |
Nacionalidad | alemán |
alma mater | Technische Universität München |
Conocido por | La inteligencia artificial , el aprendizaje profundo , redes neuronales artificiales , redes neuronales recurrentes , máquina de Gödel , la curiosidad artificial, metaaprendizaje |
Carrera científica | |
Campos | Inteligencia artificial |
Instituciones | Instituto Dalle Molle de Investigación en Inteligencia Artificial |
Sitio web | gente |
Schmidhuber realizó sus estudios de pregrado en la Technische Universität München en Munich , Alemania. [1] Enseñó allí desde 2004 hasta 2009 cuando se convirtió en profesor de inteligencia artificial en la Università della Svizzera Italiana en Lugano , Suiza. [6]
Trabaja
Con sus estudiantes Sepp Hochreiter , Felix Gers , Fred Cummins, Alex Graves y otros, Schmidhuber publicó versiones cada vez más sofisticadas de un tipo de red neuronal recurrente llamada memoria a corto plazo largo (LSTM). Los primeros resultados ya se informaron en la tesis de diploma de Hochreiter (1991) que analizó y superó el famoso problema del gradiente de fuga . [7] El nombre LSTM se introdujo en un informe técnico (1995) que dio lugar a la publicación LSTM más citada (1997). [8]
La arquitectura estándar LSTM que se utiliza en casi todas las aplicaciones actuales se introdujo en 2000. [9] La "vanilla LSTM" de hoy que utiliza la retropropagación a través del tiempo se publicó en 2005, [10] [11] y su algoritmo de entrenamiento de clasificación temporal conexionista (CTC) [12] en 2006. CTC habilitó el reconocimiento de voz de un extremo a otro con LSTM. En 2015, LSTM capacitado por CTC se utilizó en una nueva implementación de reconocimiento de voz en el software de Google para teléfonos inteligentes . [2] Google también usó LSTM para el asistente inteligente Allo [13] y para Google Translate . [14] [15] Apple usó LSTM para la función "Quicktype" en el iPhone [16] [17] y para Siri . [18] Amazon usó LSTM para Amazon Alexa . [19] En 2017, Facebook realizó alrededor de 4.500 millones de traducciones automáticas todos los días utilizando las redes LSTM. [20] Bloomberg Business Week escribió: "Estos poderes hacen de LSTM posiblemente el logro de IA más comercial, utilizado para todo, desde predecir enfermedades hasta componer música". [21]
En 2011, el equipo de Schmidhuber en IDSIA con su postdoctorado Dan Ciresan también logró aceleraciones dramáticas de las redes neuronales convolucionales (CNN) en computadoras rápidas paralelas llamadas GPU . Una CNN anterior sobre GPU de Chellapilla et al. (2006) fue 4 veces más rápido que una implementación equivalente en CPU. [22] La profunda CNN de Dan Ciresan et al. (2011) en IDSIA ya era 60 veces más rápido [23] y logró la primera actuación sobrehumana en un concurso de visión por computadora en agosto de 2011. [24] Entre el 15 de mayo de 2011 y el 10 de septiembre de 2012, sus CNN rápidos y profundos ganaron nada menos que cuatro concursos de imagen. [25] [26] También mejoraron significativamente el mejor rendimiento en la literatura para múltiples bases de datos de imágenes . [27] El enfoque se ha convertido en fundamental para el campo de la visión por computadora . [26] Se basa en diseños de CNN presentados mucho antes por Yann LeCun et al. (1989) [28] quien aplicó el algoritmo de retropropagación a una variante de la arquitectura CNN original de Kunihiko Fukushima llamada neocognitron , [29] posteriormente modificada por el método de J. Weng llamado max-pooling . [30] [26]
En 2014, Schmidhuber formó una empresa, Nnaisense, para trabajar en aplicaciones comerciales de inteligencia artificial en campos como las finanzas, la industria pesada y los vehículos autónomos . Sepp Hochreiter, Jaan Tallinn y Marcus Hutter son asesores de la empresa. [2] Las ventas fueron inferiores a 11 millones de dólares EE.UU. en 2016; sin embargo, Schmidhuber afirma que el énfasis actual está en la investigación y no en los ingresos. Nnaisense recaudó su primera ronda de financiación de capital en enero de 2017. El objetivo general de Schmidhuber es crear una IA para todo uso entrenando una sola IA en secuencia en una variedad de tareas limitadas; sin embargo, los escépticos señalan que empresas como Arago GmbH e IBM han aplicado IA a varios proyectos diferentes durante años sin mostrar ningún signo de inteligencia artificial general. [31]
Puntos de vista
Según The Guardian , [32] Schmidhuber se quejó en un "artículo mordaz de 2015" de que los investigadores de aprendizaje profundo Geoffrey Hinton , Yann LeCun y Yoshua Bengio "se citan mucho entre sí", pero "no dan crédito a los pioneros del campo", supuestamente subestimando las contribuciones de Schmidhuber y otros pioneros del aprendizaje automático, incluido Alexey Grigorevich Ivakhnenko, quien ya publicó las primeras redes de aprendizaje profundo en 1965. LeCun niega el cargo y afirma en cambio que Schmidhuber "sigue reclamando el crédito que no se merece". [2] [32]
Reconocimiento
Schmidhuber recibió el premio Helmholtz de la International Neural Network Society en 2013, [33] y el Neural Networks Pioneer Award de la IEEE Computational Intelligence Society en 2016. [34] Es miembro de la Academia Europea de Ciencias y Artes . [35] [6]
Referencias
- ^ a b c d CV
- ↑ a b c d John Markoff (27 de noviembre de 2016). Cuando la IA madura, puede llamar a Jürgen Schmidhuber "papá" . The New York Times . Consultado en abril de 2017.
- ^ Wong, Andrew (16 de mayo de 2018). "El 'padre de la IA' insta a los humanos a no temer a la tecnología" . CNBC . Consultado el 27 de febrero de 2019 .
- ^ Blunden, Mark (8 de junio de 2018). "Los humanos aprenderán a confiar en sus amigos robots, dice el experto en IA. El padre de la IA moderna cree que los robots pueden hacer compañía a las personas solitarias" . El estándar de la noche . Consultado el 27 de febrero de 2019 .
- ^ "El 'padre de la IA' insta a los humanos a no temer a la tecnología" . Poste matutino del sur de China . 16 de mayo de 2018 . Consultado el 27 de febrero de 2019 .
- ^ a b Dave O'Leary (3 de octubre de 2016). El presente y el futuro de la inteligencia artificial y el aprendizaje profundo con el profesor Jürgen Schmidhuber . IT World Canadá . Consultado en abril de 2017.
- ^ Hochreiter, S. (1991). Untersuchungen zu dynamischen neuronalen Netzen (PDF) (tesis de diploma). Universidad Técnica de Munich, Instituto de Ciencias de la Computación (asesor Jürgen Schmidhuber).
- ^ Sepp Hochreiter; Jürgen Schmidhuber (1997). "Memoria larga a corto plazo" . Computación neuronal . 9 (8): 1735-1780. doi : 10.1162 / neco.1997.9.8.1735 . PMID 9377276 . S2CID 1915014 .
- ^ Felix A. Gers; Jürgen Schmidhuber; Fred Cummins (2000). "Aprender a olvidar: predicción continua con LSTM". Computación neuronal . 12 (10): 2451–2471. CiteSeerX 10.1.1.55.5709 . doi : 10.1162 / 089976600300015015 . PMID 11032042 . S2CID 11598600 .
- ^ Graves, A .; Schmidhuber, J. (2005). "Clasificación de fonemas framewise con LSTM bidireccional y otras arquitecturas de redes neuronales". Redes neuronales . 18 (5–6): 602–610. CiteSeerX 10.1.1.331.5800 . doi : 10.1016 / j.neunet.2005.06.042 . PMID 16112549 .
- ^ Klaus Greff; Rupesh Kumar Srivastava; Jan Koutník; Bas R. Steunebrink; Jürgen Schmidhuber (2015). "LSTM: una odisea del espacio de búsqueda". Transacciones IEEE en redes neuronales y sistemas de aprendizaje . 28 (10): 2222–2232. arXiv : 1503.04069 . Código bibliográfico : 2015arXiv150304069G . doi : 10.1109 / TNNLS.2016.2582924 . PMID 27411231 . S2CID 3356463 .
- ^ Graves, Alex; Fernández, Santiago; Gómez, Faustino (2006). "Clasificación temporal conexionista: etiquetado de datos de secuencia no segmentados con redes neuronales recurrentes". En Actas de la Conferencia Internacional sobre Aprendizaje Automático, ICML 2006 : 369–376. CiteSeerX 10.1.1.75.6306 .
- ^ Khaitan, Pranav (18 de mayo de 2016). "Chatea de forma más inteligente con Allo" . Blog de investigación . Consultado el 27 de junio de 2017 .
- ^ Wu, Yonghui; Schuster, Mike; Chen, Zhifeng; Le, Quoc V .; Norouzi, Mohammad; Macherey, Wolfgang; Krikun, Maxim; Cao, Yuan; Gao, Qin (26 de septiembre de 2016). "Sistema de traducción automática neuronal de Google: cerrar la brecha entre traducción humana y automática". arXiv : 1609.08144 [ cs.CL ].
- ^ Metz, Cade (27 de septiembre de 2016). "Una infusión de IA hace que Google Translate sea más potente que nunca | WIRED" . Cableado . Consultado el 27 de junio de 2017 .
- ^ Efrati, Amir (13 de junio de 2016). "Las máquinas de Apple también pueden aprender" . La información . Consultado el 27 de junio de 2017 .
- ^ Ranger, Steve (14 de junio de 2016). "iPhone, IA y big data: así es como Apple planea proteger su privacidad | ZDNet" . ZDNet . Consultado el 27 de junio de 2017 .
- ^ Smith, Chris (13 de junio de 2016). "iOS 10: Siri ahora funciona en aplicaciones de terceros, viene con funciones adicionales de inteligencia artificial" . BGR . Consultado el 27 de junio de 2017 .
- ^ Vogels, Werner (30 de noviembre de 2016). "Llevando la magia de Amazon AI y Alexa a las aplicaciones en AWS. Todas las cosas distribuidas" . www.allthingsdistributed.com . Consultado el 27 de junio de 2017 .
- ^ Ong, Thuy (4 de agosto de 2017). "Las traducciones de Facebook ahora funcionan completamente con inteligencia artificial" . www.allthingsdistributed.com . Consultado el 15 de febrero de 2019 .
- ^ Vance, Ashlee (15 de mayo de 2018). "Cita: Estos poderes hacen de LSTM posiblemente el logro de IA más comercial, utilizado para todo, desde predecir enfermedades hasta componer música" . Semana Empresarial de Bloomberg . Consultado el 16 de enero de 2019 .
- ^ Kumar Chellapilla; Sid Puri; Patrice Simard (2006). "Redes neuronales convolucionales de alto rendimiento para el procesamiento de documentos" . En Lorette, Guy (ed.). Décimo Taller Internacional de Fronteras en el Reconocimiento de la Caligrafía . Suvisoft.
- ^ Ciresan, Dan; Ueli Meier; Jonathan Masci; Luca M. Gambardella; Jurgen Schmidhuber (2011). "Redes neuronales convolucionales flexibles de alto rendimiento para clasificación de imágenes" (PDF) . Actas de la Vigésima Segunda Conferencia Conjunta Internacional sobre Inteligencia Artificial - Volumen Dos . 2 : 1237-1242 . Consultado el 17 de noviembre de 2013 .
- ^ "Tabla de resultados de la competencia IJCNN 2011" . COMPETICIÓN OFICIAL IJCNN2011 . 2010 . Consultado el 14 de enero de 2019 .
- ^ Schmidhuber, Jürgen (17 de marzo de 2017). "Historia de los concursos de visión por computadora ganados por CNN profundos en GPU" . Consultado el 14 de enero de 2019 .
- ^ a b c Schmidhuber, Jürgen (2015). "Aprendizaje profundo" . Scholarpedia . 10 (11): 1527–54. CiteSeerX 10.1.1.76.1541 . doi : 10.1162 / neco.2006.18.7.1527 . PMID 16764513 . S2CID 2309950 .
- ^ Ciresan, Dan; Meier, Ueli; Schmidhuber, Jürgen (junio de 2012). Redes neuronales profundas de varias columnas para clasificación de imágenes . 2012 Conferencia IEEE sobre Visión por Computador y Reconocimiento de Patrones . Nueva York, NY: Instituto de Ingenieros Eléctricos y Electrónicos (IEEE). págs. 3642–3649. arXiv : 1202.2745 . CiteSeerX 10.1.1.300.3283 . doi : 10.1109 / CVPR.2012.6248110 . ISBN 978-1-4673-1226-4. OCLC 812295155 . S2CID 2161592 .
- ^ Y. LeCun, B. Boser, JS Denker, D. Henderson, RE Howard, W. Hubbard, LD Jackel, retropropagación aplicada al reconocimiento del código postal manuscrito ; Laboratorios AT&T Bell
- ^ Fukushima, Neocognitron (1980). "Un modelo de red neuronal autoorganizada para un mecanismo de reconocimiento de patrones que no se ve afectado por el cambio de posición". Cibernética biológica . 36 (4): 193–202. doi : 10.1007 / bf00344251 . PMID 7370364 . S2CID 206775608 .
- ^ Weng, J; Ahuja, N; Huang, TS (1993). "Aprendizaje de reconocimiento y segmentación de objetos 3-D a partir de imágenes 2-D". Proc. 4ta Conf. Internacional Visión por computadora : 121–128.
- ^ "AI Pioneer quiere construir la máquina renacentista del futuro" . Bloomberg.com . 16 de enero de 2017 . Consultado el 23 de febrero de 2018 .
- ^ a b Oltermann, Philip (18 de abril de 2017). "Jürgen Schmidhuber sobre el futuro de los robots: 'Nos prestarán tanta atención como nosotros a las hormigas ' " . The Guardian . Consultado el 23 de febrero de 2018 .
- ^ Destinatarios de los premios INNS . Sociedad Internacional de Redes Neuronales. Consultado en diciembre de 2016.
- ^ Destinatarios: Premio pionero de redes neuronales . Piscataway, Nueva Jersey: Sociedad de Inteligencia Computacional IEEE. Consultado en enero de 2019.]
- ^ Miembros . Academia Europea de Ciencias y Artes. Consultado en diciembre de 2016.