Aprendizaje automático

El aprendizaje automático ( ML ) es el estudio de algoritmos informáticos que pueden mejorar automáticamente a través de la experiencia y mediante el uso de datos. ^[1] Se considera parte de la inteligencia artificial . Los algoritmos de aprendizaje automático construyen un modelo basado en datos de muestra, conocidos como datos de entrenamiento , para hacer predicciones o decisiones sin estar programados explícitamente para hacerlo. ^{[2] Los} algoritmos de aprendizaje automático se utilizan en una amplia variedad de aplicaciones, como en medicina, filtrado de correo electrónico , reconocimiento de voz y visión por computadora., donde es difícil o inviable desarrollar algoritmos convencionales para realizar las tareas necesarias. ^[3]

Un subconjunto del aprendizaje automático está estrechamente relacionado con las estadísticas computacionales , que se enfoca en hacer predicciones usando computadoras; pero no todo el aprendizaje automático es aprendizaje estadístico. El estudio de la optimización matemática aporta métodos, teoría y dominios de aplicación al campo del aprendizaje automático. La minería de datos es un campo de estudio relacionado, que se centra en el análisis de datos exploratorios a través del aprendizaje no supervisado . ^[5]^[6] Algunas implementaciones de aprendizaje automático utilizan datos y redes neuronales de una manera que imita el funcionamiento de un cerebro biológico. ^[7]^[8] En su aplicación a los problemas comerciales, el aprendizaje automático también se conoce como análisis predictivo .

Los algoritmos de aprendizaje funcionan sobre la base de que es probable que las estrategias, los algoritmos y las inferencias que funcionaron bien en el pasado sigan funcionando bien en el futuro. Estas inferencias pueden ser obvias, como "dado que el sol salió todas las mañanas durante los últimos 10.000 días, probablemente también saldrá mañana por la mañana". Se pueden matizar, como "el X% de las familias tienen especies geográficamente separadas con variantes de color, por lo que hay un Y% de posibilidades de que existan cisnes negros sin descubrir ". ^[9]

Los programas de aprendizaje automático pueden realizar tareas sin estar programados explícitamente para hacerlo. Se trata de que las computadoras aprendan de los datos proporcionados para llevar a cabo determinadas tareas. Para tareas simples asignadas a computadoras, es posible programar algoritmos que le digan a la máquina cómo ejecutar todos los pasos necesarios para resolver el problema en cuestión; por parte de la computadora, no es necesario ningún aprendizaje. Para tareas más avanzadas, puede ser un desafío para un ser humano crear manualmente los algoritmos necesarios. En la práctica, puede resultar más eficaz ayudar a la máquina a desarrollar su propio algoritmo, en lugar de que los programadores humanos especifiquen cada paso necesario. ^[10]

La disciplina del aprendizaje automático emplea varios enfoques para enseñar a las computadoras a realizar tareas en las que no se dispone de un algoritmo completamente satisfactorio. En los casos en que exista una gran cantidad de respuestas potenciales, un enfoque es etiquetar algunas de las respuestas correctas como válidas. Esto luego se puede usar como datos de entrenamiento para que la computadora mejore los algoritmos que usa para determinar las respuestas correctas. Por ejemplo, para entrenar un sistema para la tarea de reconocimiento de caracteres digitales, a menudo se ha utilizado el conjunto de datos MNIST de dígitos escritos a mano. ^[10]

El término aprendizaje automático fue acuñado en 1959 por Arthur Samuel , un IBM estadounidense y pionero en el campo de los juegos de computadora y la inteligencia artificial . ^[11]^[12] También se utilizó el sinónimo de computadoras de autoaprendizaje en este período de tiempo. ^[13]^[14] Un libro representativo de la investigación del aprendizaje automático durante la década de 1960 fue el libro de Nilsson sobre Máquinas de aprendizaje, que trata principalmente del aprendizaje automático para la clasificación de patrones. ^{[15] El} interés relacionado con el reconocimiento de patrones continuó en la década de 1970, como lo describieron Duda y Hart en 1973. ^[16]En 1981 se presentó un informe sobre el uso de estrategias de enseñanza para que una red neuronal aprenda a reconocer 40 caracteres (26 letras, 10 dígitos y 4 símbolos especiales) desde una terminal de computadora. ^[17]

El aprendizaje automático como subcampo de la IA ^[21]

Parte del aprendizaje automático como subcampo de la IA o parte de la IA como subcampo del aprendizaje automático ^[22]

Una máquina de vectores de soporte es un modelo de aprendizaje supervisado que divide los datos en regiones separadas por un límite lineal . Aquí, el límite lineal divide los círculos negros del blanco.

Una red neuronal artificial es un grupo de nodos interconectados, similar a la vasta red de neuronas en un cerebro . Aquí, cada nodo circular representa una neurona artificial y una flecha representa una conexión entre la salida de una neurona artificial y la entrada de otra.

Ilustración de regresión lineal en un conjunto de datos.

Una simple red bayesiana. La lluvia influye en si el aspersor está activado, y tanto la lluvia como el aspersor influyen en si el césped está mojado.

La línea azul podría ser un ejemplo de sobreajuste de una función lineal debido al ruido aleatorio.