El aumento de datos en el análisis de datos son técnicas que se utilizan para aumentar la cantidad de datos agregando copias ligeramente modificadas de datos ya existentes o datos sintéticos recién creados a partir de datos existentes. Actúa como un regularizador y ayuda a reducir el sobreajuste al entrenar un modelo de aprendizaje automático. [1] Está estrechamente relacionado con el sobremuestreo en el análisis de datos.
Técnicas de sobremuestreo sintético para el aprendizaje automático tradicional
Aumento de datos para clasificación de imágenes
Transformaciones de imágenes
Las transformaciones geométricas, el volteo, la modificación del color, el recorte, la rotación, la inyección de ruido y el borrado aleatorio se utilizan para aumentar la imagen en el aprendizaje profundo. [1]
Presentamos nuevas imágenes sintéticas
Si se enfrenta el problema de la escasez de datos, las técnicas simples pero efectivas, como las transformaciones, pueden plantear una solución limitada. Si un conjunto de datos es demasiado pequeño, entonces un conjunto de imágenes transformadas mediante rotación y duplicación, etc., puede ser aún demasiado pequeño para un problema determinado. Otra solución es la obtención de imágenes completamente nuevas y sintéticas a través de diversas técnicas, por ejemplo, el uso de redes generativas de confrontación para crear nuevas imágenes sintéticas para el aumento de datos. [1] Además, los algoritmos de reconocimiento de imágenes muestran mejoras cuando se transfieren desde imágenes sintéticas generadas por Unity Game Engine, [3] es decir, para mejorar el aprendizaje de datos del mundo real al aumentar el proceso de entrenamiento con imágenes renderizadas de entornos virtuales.
Aumento de datos para procesamiento de señales
Señales biológicas
El aumento de datos sintéticos es de suma importancia para la clasificación del aprendizaje automático, en particular para los datos biológicos, que tienden a ser muy dimensionales y escasos. Las aplicaciones del control robótico y el aumento en sujetos discapacitados y sanos todavía se basan principalmente en análisis específicos de sujetos. La escasez de datos es notable en los problemas de procesamiento de señales, como las señales de electromiografía de la enfermedad de Parkinson , que son difíciles de obtener - Zanini, et al. señaló que es posible utilizar una red adversaria generativa (en particular, una DCGAN) para realizar la transferencia de estilo con el fin de generar señales electromiográficas sintéticas que se correspondan con las exhibidas por los pacientes de la enfermedad de Parkinson. [4]
Los enfoques también son importantes en la electroencefalografía (ondas cerebrales). Wang y col. exploraron la idea de usar redes neuronales convolucionales profundas para el reconocimiento de emociones basado en EEG, los resultados muestran que el reconocimiento de emociones mejoró cuando se utilizó el aumento de datos. [5]
También se ha observado que el modelo GPT-2 de OpenAI es capaz de aprender y generar señales biológicas sintéticas como EEG y EMG. [6] En este estudio, se observó que el reconocimiento se mejoró mediante el aumento de datos. También se señaló que los modelos estadísticos de aprendizaje automático entrenados en el dominio sintético podrían clasificar los datos humanos y viceversa. En la imagen, se dan una comparación por algunos ejemplos de EEG producidos por el modelo GPT-2 y un cerebro humano.
Un enfoque común es generar señales sintéticas reordenando componentes de datos reales. Lotte [7] propuso un método de "generación de prueba artificial basada en la analogía" donde tres ejemplos de datos proporcionar ejemplos y un artificial se forma que es para qué Es para . Se aplica una transformación a para hacerlo más similar a , la misma transformación se aplica luego a que genera . Se demostró que este enfoque mejora el rendimiento de un clasificador de análisis discriminante lineal en tres conjuntos de datos diferentes.
La investigación actual muestra que se puede derivar un gran impacto de técnicas relativamente simples. Por ejemplo, Freer [8] observó que la introducción de ruido en los datos recopilados para formar puntos de datos adicionales mejoró la capacidad de aprendizaje de varios modelos que, por lo demás, se desempeñaron relativamente mal. Tsinganos y col. [9] estudiaron los enfoques de deformación de magnitud, descomposición de ondículas y modelos EMG de superficie sintética (enfoques generativos) para el reconocimiento de gestos con las manos, encontrando aumentos en el rendimiento de clasificación de hasta + 16% cuando se introdujeron datos aumentados durante el entrenamiento. Más recientemente, los estudios de aumento de datos han comenzado a centrarse en el campo del aprendizaje profundo, más específicamente en la capacidad de los modelos generativos para crear datos artificiales que luego se introducen durante el proceso de entrenamiento del modelo de clasificación. En 2018, Luo et al. [10] observó que los datos de señales de EEG útiles podían ser generados por las Redes Adversarias Generativas Condicionales de Wasserstein (GAN) que luego se introdujeron en el conjunto de entrenamiento en un marco de aprendizaje clásico de prueba de tren. Los autores encontraron que el rendimiento de la clasificación mejoró cuando se introdujeron tales técnicas.
Aumento de datos para el reconocimiento de voz
Se ha observado que la generación de datos sintéticos de MFCC hablados puede mejorar el reconocimiento de un hablante a partir de sus enunciados mediante el aprendizaje de transferencia a partir de datos sintéticos que se han generado a través de una red neuronal recurrente a nivel de carácter (RNN). [11]
Ver también
Referencias
- ^ a b c Acorta, Connor; Khoshgoftaar, Taghi M. (2019). "Una encuesta sobre el aumento de datos de imágenes para el aprendizaje profundo" . Matemáticas y Computación en Simulación . saltador. 6 : 60. doi : 10.1186 / s40537-019-0197-0 .
- ^ D Bloice, Marcus; Stocker, Christof; Holzinger, Andreas (2017). "Augmentor: una biblioteca de aumento de imágenes para el aprendizaje automático" . La revista del software de código abierto . 2 (19): 432. Código bibliográfico : 2017JOSS .... 2..432D . doi : 10.21105 / joss.00432 . ISSN 2475-9066 .
- ^ Bird, Jordan J; Faria, Diego R; Ekart, Aniko; Ayrosa, Pedro PS (30/08/2020). De la simulación a la realidad: aprendizaje de transferencia de CNN para clasificación de escenas . 2020 IEEE 10th International Conference on Intelligent Systems (SI). Varna, Bulgaria: IEEE. págs. 619–625.Mantenimiento CS1: fecha y año ( enlace )
- ^ Anicet Zanini, Rafael; Luna Colombini, Esther (2020). "Aumento y simulación de datos EMG de enfermedad de Parkinson con DCGAN y transferencia de estilo" . Sensores . 20 (9): 2605. doi : 10,3390 / s20092605 . ISSN 1424-8220 . PMC 7248755 . PMID 32375217 .
- ^ Wang, Fang; Zhong, Sheng-hua; Peng, Jianfeng; Jiang, Jianmin; Liu, Yan (2018). "Aumento de datos para el reconocimiento de emociones basado en EEG con redes neuronales convolucionales profundas". Múltiples medios de modelado . Apuntes de conferencias en informática. 10705 . págs. 82–93. doi : 10.1007 / 978-3-319-73600-6_8 . ISBN 978-3-319-73599-3. ISSN 0302-9743 .
- ^ a b Bird, Jordan J .; Pritchard, Michael George; Fratini, Antonio; Ekart, Aniko; Faria, Diego (2021). "Las señales biológicas sintéticas generadas por máquina por GPT-2 mejoran la clasificación de EEG y EMG a través del aumento de datos" (PDF) . IEEE Robotics and Automation Letters . 6 (2): 3498–3504. doi : 10.1109 / LRA.2021.3056355 . ISSN 2377-3766 . S2CID 232373183 .
- ^ Lotte, Fabien (2015). "Enfoques de procesamiento de señales para minimizar o suprimir el tiempo de calibración en interfaces cerebro-computadora basadas en actividad oscilatoria". Actas del IEEE . 103 (6): 871–890. doi : 10.1109 / JPROC.2015.2404941 . ISSN 0018-9219 . S2CID 22472204 .
- ^ Más libre, Daniel; Yang, Guang-Zhong (2020). "Aumento de datos para la clasificación de imágenes motoras a su propio ritmo con C-LSTM". Revista de Ingeniería Neural . 17 (1): 016041. Código Bibliográfico : 2020JNEng..17a6041F . doi : 10.1088 / 1741-2552 / ab57c0 . hdl : 10044/1/75376 . ISSN 1741-2552 . PMID 31726440 .
- ^ Tsinganos, Panagiotis; Cornelis, Bruno; Cornelis, Jan; Jansen, Bart; Skodras, Athanassios (2020). "Aumento de datos de electromiografía de superficie para el reconocimiento de gestos de la mano" . Sensores . 20 (17): 4892. doi : 10.3390 / s20174892 . ISSN 1424-8220 . PMC 7506981 . PMID 32872508 .
- ^ Luo, Yun; Lu, Bao-Liang (2018). "Aumento de datos de EEG para el reconocimiento de emociones utilizando una GAN de Wasserstein condicional". 2018 40th Annual International Conference of the IEEE Engineering in Medicine and Biology Society (EMBC) . Conferencia internacional anual de la Sociedad de Ingeniería en Medicina y Biología del IEEE. Sociedad de Ingeniería en Medicina y Biología del IEEE. Conferencia Internacional Anual . 2018 . págs. 2535-2538. doi : 10.1109 / EMBC.2018.8512865 . ISBN 978-1-5386-3646-6. PMID 30440924 . S2CID 53105445 .
- ^ Bird, Jordan J .; Faria, Diego R .; Premebida, Cristiano; Ekart, Aniko; Ayrosa, Pedro PS (2020). "Superar la escasez de datos en la identificación de locutor: aumento del conjunto de datos con MFCC sintéticos a través de RNN a nivel de carácter". 2020 IEEE International Conference on Autonomous Robot Systems and Competitions (ICARSC) . págs. 146-151. doi : 10.1109 / ICARSC49921.2020.9096166 . ISBN 978-1-7281-7078-7. S2CID 218832459 .