Aprendizaje de características


En el aprendizaje automático, el aprendizaje de características o el aprendizaje de representaciones [2] es un conjunto de técnicas que permite que un sistema descubra automáticamente las representaciones necesarias para la detección o clasificación de características a partir de datos sin procesar. Esto reemplaza la ingeniería manual de funciones y permite que una máquina aprenda las funciones y las use para realizar una tarea específica.

El aprendizaje de características está motivado por el hecho de que las tareas de aprendizaje automático, como la clasificación , a menudo requieren una entrada que sea matemática y computacionalmente conveniente para procesar. Sin embargo, los datos del mundo real, como imágenes, videos y datos de sensores, no han cedido ante los intentos de definir algorítmicamente características específicas. Una alternativa es descubrir tales características o representaciones a través del examen, sin depender de algoritmos explícitos.

El aprendizaje de características supervisado es el aprendizaje de características a partir de datos etiquetados. La etiqueta de datos permite que el sistema calcule un término de error, el grado en que el sistema no produce la etiqueta, que luego puede usarse como retroalimentación para corregir el proceso de aprendizaje (reducir/minimizar el error). Los enfoques incluyen:

El aprendizaje del diccionario desarrolla un conjunto (diccionario) de elementos representativos a partir de los datos de entrada, de modo que cada punto de datos se puede representar como una suma ponderada de los elementos representativos. Los elementos del diccionario y los pesos se pueden encontrar minimizando el error de representación promedio (sobre los datos de entrada), junto con la regularización L1 de los pesos para permitir la escasez (es decir, la representación de cada punto de datos tiene solo unos pocos pesos distintos de cero).

El aprendizaje de diccionario supervisado explota tanto la estructura subyacente a los datos de entrada como las etiquetas para optimizar los elementos del diccionario. Por ejemplo, esta [12] técnica de aprendizaje de diccionario supervisado aplica el aprendizaje de diccionario en problemas de clasificación mediante la optimización conjunta de los elementos del diccionario, los pesos para representar puntos de datos y los parámetros del clasificador en función de los datos de entrada. En particular, se formula un problema de minimización, donde la función objetivo consiste en el error de clasificación, el error de representación, una regularización L1 en los pesos que representan para cada punto de datos (para permitir una representación dispersa de datos) y una regularización L2 en los parámetros del clasificador.

Las redes neuronales son una familia de algoritmos de aprendizaje que utilizan una "red" que consta de varias capas de nodos interconectados. Está inspirado en el sistema nervioso animal, donde los nodos se ven como neuronas y los bordes se ven como sinapsis. Cada borde tiene un peso asociado y la red define reglas computacionales para pasar datos de entrada desde la capa de entrada de la red a la capa de salida. Una función de red asociada con una red neuronal caracteriza la relación entre las capas de entrada y salida, que está parametrizada por los pesos. Con funciones de red definidas apropiadamente, se pueden realizar varias tareas de aprendizaje minimizando una función de costo sobre la función de red (pesos).


Diagrama del paradigma de aprendizaje de funciones en el aprendizaje automático para su aplicación a tareas posteriores, que se pueden aplicar a datos sin procesar, como imágenes o texto, o a un conjunto inicial de funciones para los datos. El aprendizaje de funciones está destinado a dar como resultado un entrenamiento más rápido o un mejor rendimiento en configuraciones específicas de tareas que si los datos se ingresaran directamente. [1]