Ruido determinista


De Wikipedia, la enciclopedia libre
Saltar a navegación Saltar a búsqueda

En el aprendizaje automático (supervisado) , específicamente cuando se aprende de los datos, hay situaciones en las que los valores de los datos no se pueden modelar. Esto puede surgir si hay fluctuaciones aleatorias o errores de medición en los datos que no están modelados y que pueden llamarse apropiadamente ruido estocástico ; o, cuando el fenómeno que se modela (o se aprende) es demasiado complejo y, por lo tanto, los datos contienen esta complejidad adicional que no se modela. Esta complejidad adicional en los datos se ha denominado ruido determinista . [1]Aunque estos dos tipos de ruido surgen de diferentes causas, su efecto adverso sobre el aprendizaje es similar. El sobreajuste se produce porque el modelo intenta ajustar el ruido (estocástico o determinista) (esa parte de los datos que no puede modelar) a expensas de ajustar esa parte de los datos que puede modelar. Cuando está presente cualquier tipo de ruido, generalmente es aconsejable regularizar el algoritmo de aprendizaje para evitar sobreajustar el modelo a los datos y obtener un rendimiento inferior. La regularización generalmente da como resultado un modelo de varianza más baja a expensas del sesgo .

También se puede intentar aliviar los efectos del ruido detectando y eliminando los ejemplos de entrenamiento ruidosos antes de entrenar el algoritmo de aprendizaje supervisado. Hay varios algoritmos que identifican ejemplos de entrenamiento ruidosos, y la eliminación de los ejemplos de entrenamiento ruidosos sospechosos antes del entrenamiento generalmente mejorará el rendimiento. [2] [3]

Referencias

  1. ^ Yaser S.Abu-Mostafa; Malik Magdon-Ismail; Hsuan-Tien Lin (marzo de 2012). Aprendiendo de los datos . amlbook.
  2. ^ CE Brodely y MA Friedl (1999). Identificación y eliminación de instancias de entrenamiento mal etiquetadas, Journal of Artificial Intelligence Research 11, 131-167. ( http://jair.org/media/606/live-606-1803-jair.pdf Archivado el 12 de mayo de 2016 en Wayback Machine )
  3. ^ MR Smith; T. Martínez (2011). "Mejorar la precisión de la clasificación mediante la identificación y eliminación de instancias que deberían clasificarse erróneamente". Actas de la Conferencia conjunta internacional sobre redes neuronales (IJCNN 2011) . págs. 2690–2697. doi : 10.1109 / IJCNN.2011.6033571 .