Lista de conjuntos de datos para la investigación de aprendizaje automático


Estos conjuntos de datos se aplican para la investigación de aprendizaje automático y se han citado en revistas académicas revisadas por pares. Los conjuntos de datos son una parte integral del campo del aprendizaje automático. Los avances importantes en este campo pueden resultar de los avances en los algoritmos de aprendizaje (como el aprendizaje profundo ), el hardware de la computadora y, de manera menos intuitiva, la disponibilidad de conjuntos de datos de entrenamiento de alta calidad. [1] Conjuntos de datos de entrenamiento etiquetados de alta calidad para supervisados y semisupervisadosLos algoritmos de aprendizaje automático suelen ser difíciles y costosos de producir debido a la gran cantidad de tiempo que se necesita para etiquetar los datos. Aunque no es necesario etiquetarlos, los conjuntos de datos de alta calidad para el aprendizaje no supervisado también pueden ser difíciles y costosos de producir. [2] [3] [4] [5]

Conjuntos de datos que consisten principalmente en imágenes o videos para tareas como detección de objetos , reconocimiento facial y clasificación de etiquetas múltiples .

En visión artificial , las imágenes de rostros se han utilizado ampliamente para desarrollar sistemas de reconocimiento facial , detección de rostros y muchos otros proyectos que utilizan imágenes de rostros.

Conjuntos de datos que consisten principalmente en texto para tareas como procesamiento de lenguaje natural , análisis de sentimientos , traducción y análisis de conglomerados .

Conjuntos de datos que contienen información de señales eléctricas que requieren algún tipo de procesamiento de señales para su posterior análisis.

Conjuntos de datos que consisten en filas de observaciones y columnas de atributos que caracterizan esas observaciones. Normalmente se usa para análisis de regresión o clasificación, pero también se pueden usar otros tipos de algoritmos. Esta sección incluye conjuntos de datos que no encajan en las categorías anteriores.