El aprendizaje por transferencia (TL) es un problema de investigación en aprendizaje automático (ML) que se centra en almacenar el conocimiento adquirido mientras se resuelve un problema y se aplica a un problema diferente pero relacionado. [1] Por ejemplo, el conocimiento adquirido al aprender a reconocer automóviles podría aplicarse al intentar reconocer camiones. Esta área de investigación guarda alguna relación con la larga historia de la literatura psicológica sobre la transferencia del aprendizaje , aunque los vínculos formales entre los dos campos son limitados. Desde el punto de vista práctico, reutilizar o transferir información de tareas previamente aprendidas para el aprendizaje de nuevas tareas tiene el potencial de mejorar significativamente la eficiencia de la muestra de un agente de aprendizaje por refuerzo .[2]
Historia
En 1976, Stevo Bozinovski y Ante Fulgosi publicaron un artículo que abordaba explícitamente el aprendizaje por transferencia en el entrenamiento de redes neuronales. [3] [4] El artículo ofrece un modelo matemático y geométrico de aprendizaje por transferencia. En 1981 se presentó un informe sobre la aplicación del aprendizaje por transferencia en el entrenamiento de una red neuronal en un conjunto de datos de imágenes que representan letras de terminales de computadora. Se demostró experimentalmente el aprendizaje por transferencia tanto positivo como negativo. [5]
En 1993, Lorien Pratt publicó un artículo sobre la transferencia en el aprendizaje automático , formulando el algoritmo de transferencia basada en discriminabilidad (DBT). [6]
En 1997, Pratt y Sebastian Thrun editaron como invitado un número especial de Machine Learning dedicado al aprendizaje por transferencia, [7] y en 1998, el campo había avanzado para incluir el aprendizaje multitarea , [8] junto con un análisis más formal de su teoría cimientos. [9] Learning to Learn , [10] editado por Thrun y Pratt, es una revisión de 1998 del tema.
El aprendizaje por transferencia también se ha aplicado en la ciencia cognitiva , y Pratt también ha publicado como invitado un número de Connection Science sobre la reutilización de redes neuronales a través de la transferencia en 1996. [11]
Andrew Ng dijo en su tutorial NIPS 2016 [12] [13] [14] que TL será el próximo impulsor del éxito comercial de ML después del aprendizaje supervisado para resaltar la importancia de TL.
Definición
La definición de aprendizaje por transferencia se da en términos de dominios y tareas. Un dominioconsta de: un espacio de características y una distribución de probabilidad marginal , dónde . Dado un dominio específico,, una tarea consta de dos componentes: un espacio de etiqueta y una función predictiva objetiva . La función se utiliza para predecir la etiqueta correspondiente de una nueva instancia . Esta tarea, denotada por, se aprende de los datos de entrenamiento que consisten en pares , dónde y . [15]
Dado un dominio de origen y tarea de aprendizaje , un dominio de destino y tarea de aprendizaje , dónde , o , el aprendizaje de transferencia tiene como objetivo ayudar a mejorar el aprendizaje de la función predictiva objetivo en usando el conocimiento en y . [15]
Aplicaciones
Los algoritmos están disponibles para el aprendizaje por transferencia en redes lógicas de Markov [16] y redes bayesianas . [17] El aprendizaje por transferencia también se ha aplicado al descubrimiento de subtipos de cáncer, [18] utilización de edificios , [19] [20] juegos generales , [21] clasificación de texto , [22] [23] reconocimiento de dígitos, [24] imágenes médicas y filtrado de spam . [25]
En 2020 se descubrió que, debido a sus naturalezas físicas similares, el aprendizaje de transferencia es posible entre las señales electromiográficas (EMG) de los músculos al clasificar los comportamientos de las ondas cerebrales electroencefalográficas (EEG) desde el dominio de reconocimiento de gestos hasta el dominio de reconocimiento del estado mental. También se observó que esta relación funcionaba al revés, lo que demuestra que el EEG también se puede utilizar para clasificar EMG. [26] Los experimentos observaron que la precisión de las redes neuronales y las redes neuronales convolucionales se mejoró [27] a través del aprendizaje de transferencia tanto en la primera época (antes de cualquier aprendizaje, es decir, en comparación con la distribución de peso aleatoria estándar) y en la asíntota (la final del proceso de aprendizaje). Es decir, los algoritmos se mejoran con la exposición a otro dominio. Además, el usuario final de un modelo previamente entrenado puede cambiar la estructura de capas completamente conectadas para lograr un rendimiento superior. [28]
Ver también
- Crossover (algoritmo genético)
- Adaptación de dominio
- Juego general
- Aprendizaje multitarea
- Optimización multitarea
Referencias
- ^ Oeste, Jeremy; Ventura, Dan; Warnick, Sean (2007). "Presentación de investigación de primavera: una base teórica para la transferencia inductiva" . Universidad Brigham Young, Facultad de Ciencias Físicas y Matemáticas. Archivado desde el original el 1 de agosto de 2007 . Consultado el 5 de agosto de 2007 .
- ^ George Karimpanal, Thommen; Bouffanais, Roland (2019). "Mapas autoorganizados para el almacenamiento y transferencia de conocimientos en el aprendizaje por refuerzo". Comportamiento adaptativo . 27 (2): 111-126. arXiv : 1811.08318 . doi : 10.1177 / 1059712318818568 . ISSN 1059-7123 . S2CID 53774629 .
- ^ Stevo. Bozinovski y Ante Fulgosi (1976). "La influencia de la similitud de patrones y el aprendizaje de transferencia en el entrenamiento de un perceptrón base B2". (original en croata) Actas del Simposio Informatica 3-121-5, Bled.
- ^ Stevo Bozinovski (2020) "Recordatorio del primer artículo sobre el aprendizaje por transferencia en redes neuronales, 1976". Informatica 44: 291–302.
- ^ S. Bozinovski (1981). "Espacio de enseñanza: un concepto de representación para la clasificación de patrones adaptativos". Informe técnico de COINS, Universidad de Massachusetts en Amherst, No 81-28 [disponible en línea: UM-CS-1981-028.pdf]
- ^ Pratt, LY (1993). "Transferencia basada en la discriminación entre redes neuronales" (PDF) . Conferencia NIPS: Avances en sistemas de procesamiento de información neuronal 5 . Editores Morgan Kaufmann. págs. 204–211.
- ^ Pratt, LY; Thrun, Sebastian (julio de 1997). "Aprendizaje automático - Número especial sobre transferencia inductiva" . link.springer.com . Springer . Consultado el 10 de agosto de 2017 .
- ^ Caruana, R., "Aprendizaje multitarea", págs. 95-134 en Thrun & Pratt 2012
- ^ Baxter, J., "Modelos teóricos de aprender a aprender", págs. 71-95 Thrun & Pratt 2012
- ^ Thrun y Pratt 2012 .
- ^ Pratt, L. (1996). "Número especial: reutilización de redes neuronales mediante transferencia" . Ciencia de la conexión . 8 (2) . Consultado el 10 de agosto de 2017 .
- ^ Tutorial de NIPS 2016: "Tuercas y tornillos de la creación de aplicaciones de IA mediante el aprendizaje profundo" por Andrew Ng , consultado el 28 de diciembre de 2019
- ^ "Calendario NIPS 2016" . nips.cc . Consultado el 28 de diciembre de 2019 .
- ^ Tuercas y tornillos de la creación de aplicaciones de inteligencia artificial utilizando Deep Learning, diapositivas
- ^ a b Lin, Yuan-Pin; Jung, Tzyy-Ping (27 de junio de 2017). "Mejora de la clasificación de emociones basada en EEG mediante el aprendizaje de transferencia condicional" . Fronteras en neurociencia humana . 11 : 334. doi : 10.3389 / fnhum.2017.00334 . PMC 5486154 . PMID 28701938 . El material se copió de esta fuente, que está disponible bajo una licencia internacional Creative Commons Attribution 4.0 .
- ^ Mihalkova, Lilyana; Huynh, Tuyen; Mooney, Raymond J. (julio de 2007), "Mapeo y revisión de redes lógicas de Markov para la transferencia" (PDF) , Actas de aprendizaje de la 22ª Conferencia AAAI sobre inteligencia artificial (AAAI-2007) , Vancouver, BC, págs. 608–614 , consultado el 2007-08-05
- ^ Niculescu-Mizil, Alexandru; Caruana, Rich (21-24 marzo de 2007), "La transferencia inductiva de red bayesiana de aprendizaje Estructura" (PDF) , Actas de la undécima Conferencia Internacional sobre Inteligencia Artificial y Estadística (AISTATS 2007) , recuperada 2007-08-05
- ^ Hajiramezanali, E. & Dadaneh, SZ & Karbalayghareh, A. & Zhou, Z. & Qian, X. Aprendizaje de múltiples dominios bayesianos para el descubrimiento de subtipos de cáncer a partir de datos de recuento de secuenciación de próxima generación. 32a Conferencia sobre sistemas de procesamiento de información neuronal (NeurIPS 2018), Montreal, Canadá. arXiv : 1810.09433
- ^ Arief-Ang, IB; Salim, FD; Hamilton, M. (8 de noviembre de 2017). DA-HOC: adaptación de dominio semisupervisado para la predicción de ocupación de habitaciones utilizando datos de sensores de CO2 . 4ª Conferencia Internacional ACM sobre sistemas para entornos construidos energéticamente eficientes (BuildSys). Delft, Holanda. págs. 1-10. doi : 10.1145 / 3137133.3137146 . ISBN 978-1-4503-5544-5.
- ^ Arief-Ang, IB; Hamilton, M .; Salim, FD (1 de diciembre de 2018). "Una predicción escalable de ocupación de habitaciones con descomposición de series de tiempo transferibles de datos de sensores de CO2". Transacciones ACM en redes de sensores . 14 (3–4): 21: 1–21: 28. doi : 10.1145 / 3217214 . S2CID 54066723 .
- ^ Banerjee, Bikramjit y Peter Stone. " Aprendizaje general de juegos mediante la transferencia de conocimientos ". IJCAI. 2007.
- ^ Hazlo, Chuong B .; Ng, Andrew Y. (2005). "Transferir el aprendizaje para la clasificación de textos". Fundación de sistemas de procesamiento de información neuronal, NIPS * 2005 (PDF) . Consultado el 5 de agosto de 2007 .
- ^ Rajat, Raina; Ng, Andrew Y .; Koller, Daphne (2006). "Construyendo Prioritarios Informativos utilizando Transfer Learning". Vigésimo Tercera Conferencia Internacional sobre Aprendizaje Automático (PDF) . Consultado el 5 de agosto de 2007 .
- ^ Maitra, DS; Bhattacharya, U .; Parui, SK (agosto de 2015). "Enfoque común basado en CNN para el reconocimiento de caracteres escritos a mano de varios guiones". 2015 Decimotercera Conferencia Internacional sobre Análisis y Reconocimiento de Documentos (ICDAR) : 1021–1025. doi : 10.1109 / ICDAR.2015.7333916 . ISBN 978-1-4799-1805-8. S2CID 25739012 .
- ^ Bickel, Steffen (2006). "Resumen de ECML-PKDD Discovery Challenge 2006". Taller de desafío de descubrimiento de ECML-PKDD (PDF) . Consultado el 5 de agosto de 2007 .
- ^ Bird, Jordan J .; Kobylarz, Jhonatan; Faria, Diego R .; Ekart, Aniko; Ribeiro, Eduardo P. (2020). "Aprendizaje de transferencia entre dominios MLP y CNN para el procesamiento de señales biológicas: EEG y EMG" . Acceso IEEE . Instituto de Ingenieros Eléctricos y Electrónicos (IEEE). 8 : 54789–54801. doi : 10.1109 / access.2020.2979074 . ISSN 2169-3536 .
- ^ Maitra, Durjoy Sen; Bhattacharya, Ujjwal; Parui, Swapan K. (agosto de 2015). "Enfoque común basado en CNN para el reconocimiento de caracteres escritos a mano de varios guiones" . 2015 Decimotercera Conferencia Internacional sobre Análisis y Reconocimiento de Documentos (ICDAR) : 1021–1025. doi : 10.1109 / ICDAR.2015.7333916 .
- ^ Kabir, HM, Abdar, M., Jalali, SMJ, Khosravi, A., Atiya, AF, Nahavandi, S. y Srinivasan, D. (2020). Spinalnet: red neuronal profunda con entrada gradual. preimpresión de arXiv arXiv: 2007.03347.
Fuentes
- Thrun, Sebastian; Pratt, Lorien (6 de diciembre de 2012). Aprendiendo a aprender . Springer Science & Business Media. ISBN 978-1-4615-5529-2.