La minería de datos educativos ( EDM ) describe un campo de investigación relacionado con la aplicación de la minería de datos , el aprendizaje automático y las estadísticas a la información generada en entornos educativos (por ejemplo, universidades y sistemas de tutoría inteligentes ). En un nivel alto, el campo busca desarrollar y mejorar métodos para explorar estos datos, que a menudo tienen múltiples niveles de jerarquía significativa , con el fin de descubrir nuevos conocimientos sobre cómo las personas aprenden en el contexto de tales entornos. [1] Al hacerlo, EDM ha contribuido a las teorías del aprendizaje investigadas por investigadores enpsicología educativa y ciencias del aprendizaje . [2] El campo está estrechamente relacionado con el de la analítica del aprendizaje , y los dos se han comparado y contrastado. [3]
Definición
La minería de datos educativos se refiere a técnicas, herramientas e investigaciones diseñadas para extraer automáticamente el significado de grandes depósitos de datos generados por o relacionados con las actividades de aprendizaje de las personas en entornos educativos. [4] Muy a menudo, estos datos son extensos, detallados y precisos. Por ejemplo, varios sistemas de gestión del aprendizaje (LMS) rastrean información como cuándo cada estudiante accedió a cada objeto de aprendizaje , cuántas veces lo accedió y cuántos minutos se mostró el objeto de aprendizaje en la pantalla de la computadora del usuario. Como otro ejemplo, los sistemas de tutoría inteligentes registran datos cada vez que un alumno presenta una solución a un problema. Pueden recopilar la hora del envío, si la solución coincide o no con la solución esperada, la cantidad de tiempo que ha pasado desde el último envío, el orden en el que se ingresaron los componentes de la solución en la interfaz, etc. La precisión de estos datos Es tal que incluso una sesión bastante corta con un entorno de aprendizaje informático ( por ejemplo, 30 minutos) puede producir una gran cantidad de datos de proceso para su análisis.
En otros casos, los datos son menos detallados. Por ejemplo, un estudiante de la Universidad de transcripción puede contener una lista ordenado temporalmente de cursos tomados por el estudiante, el grado que el estudiante obtuvo en cada supuesto , y cuando el estudiante seleccionar o cambiar su especialidad académica . EDM aprovecha ambos tipos de datos para descubrir información significativa sobre diferentes tipos de estudiantes y cómo aprenden, la estructura del conocimiento del dominio y el efecto de las estrategias de instrucción integradas en varios entornos de aprendizaje. Estos análisis proporcionan nueva información que sería difícil de discernir al observar los datos sin procesar . Por ejemplo, el análisis de datos de un LMS puede revelar una relación entre los objetos de aprendizaje a los que un estudiante accedió durante el curso y su calificación final del curso. De manera similar, el análisis de los datos del expediente académico del estudiante puede revelar una relación entre la calificación de un estudiante en un curso en particular y su decisión de cambiar su especialización académica. Dicha información proporciona información sobre el diseño de entornos de aprendizaje, lo que permite a los estudiantes, maestros, administradores escolares y responsables de políticas educativas tomar decisiones informadas sobre cómo interactuar con, proporcionar y administrar los recursos educativos.
Historia
Si bien el análisis de datos educativos no es en sí mismo una práctica nueva, los avances recientes en la tecnología educativa , incluido el aumento de la potencia informática y la capacidad de registrar datos detallados sobre el uso de los estudiantes de un entorno de aprendizaje basado en computadora, han llevado a una mayor interés en desarrollar técnicas para analizar la gran cantidad de datos generados en entornos educativos. Este interés se tradujo en una serie de talleres de electroerosión que se llevaron a cabo entre 2000 y 2007 como parte de varias conferencias internacionales de investigación . [5] En 2008, un grupo de investigadores estableció lo que se ha convertido en una conferencia internacional anual de investigación sobre EDM, la primera de las cuales tuvo lugar en Montreal, Quebec , Canadá. [6]
A medida que el interés en EDM siguió aumentando, los investigadores de EDM establecieron una revista académica en 2009, Journal of Educational Data Mining , para compartir y difundir los resultados de la investigación. En 2011, los investigadores de EDM establecieron la Sociedad Internacional de Minería de Datos Educativos para conectar a los investigadores de EDM y continuar ampliando el campo.
Con la introducción de repositorios de datos educativos públicos en 2008, como el DataShop del Centro de Ciencias del Aprendizaje de Pittsburgh ( PSLC ) y el Centro Nacional de Estadísticas de Educación (NCES), los conjuntos de datos públicos han hecho que la minería de datos educativos sea más accesible y factible, contribuyendo a su crecimiento. [7]
Metas
Ryan S. Baker y Kalina Yacef [8] identificaron los siguientes cuatro objetivos de EDM:
- Predecir el comportamiento de aprendizaje futuro de los estudiantes : con el uso del modelo de los estudiantes , este objetivo se puede lograr mediante la creación de modelos de estudiantes que incorporen las características del alumno, incluida información detallada, como sus conocimientos, comportamientos y motivación para aprender. La experiencia de usuario del alumno y su total satisfacción con el aprendizaje también se miden.
- Descubrimiento o mejora de modelos de dominio : a través de los diversos métodos y aplicaciones de EDM, es posible descubrir nuevos modelos y mejoras a los existentes. Los ejemplos incluyen ilustrar el contenido educativo para involucrar a los estudiantes y determinar las secuencias de instrucción óptimas para apoyar el estilo de aprendizaje del estudiante.
- Estudiar los efectos del apoyo educativo que se puede lograr a través de los sistemas de aprendizaje.
- Avanzar en el conocimiento científico sobre el aprendizaje y los estudiantes mediante la construcción e incorporación de modelos de estudiantes, el campo de la investigación de EDM y la tecnología y el software utilizados.
Usuarios y partes interesadas
Hay cuatro usuarios principales y partes interesadas involucradas con la minería de datos educativos. Éstas incluyen:
- Estudiantes : los estudiantes están interesados en comprender las necesidades y los métodos de los estudiantes para mejorar la experiencia y el rendimiento del estudiante. [9] Por ejemplo, los alumnos también pueden beneficiarse del conocimiento descubierto mediante el uso de las herramientas EDM para sugerir actividades y recursos que pueden utilizar en función de sus interacciones con la herramienta de aprendizaje en línea y los conocimientos de alumnos pasados o similares. [10] Para los estudiantes más jóvenes, la minería de datos educativos también puede informar a los padres sobre el progreso de aprendizaje de sus hijos. [11] También es necesario agrupar a los alumnos de forma eficaz en un entorno en línea. El desafío es utilizar los datos complejos para aprender e interpretar estos grupos mediante el desarrollo de modelos procesables. [12]
- Educadores : los educadores intentan comprender el proceso de aprendizaje y los métodos que pueden utilizar para mejorar sus métodos de enseñanza. [9] Los educadores pueden usar las aplicaciones de EDM para determinar cómo organizar y estructurar el plan de estudios , los mejores métodos para entregar información del curso y las herramientas que deben usar para involucrar a sus alumnos en los resultados de aprendizaje óptimos. [13] En particular, la destilación de datos para la técnica del juicio humano brinda una oportunidad para que los educadores se beneficien de la EDM porque permite a los educadores identificar rápidamente patrones de comportamiento, que pueden respaldar sus métodos de enseñanza durante la duración del curso o para mejorar cursos futuros. . Los educadores pueden determinar indicadores que muestren la satisfacción y el compromiso de los estudiantes con el material del curso, y también monitorear el progreso del aprendizaje. [13]
- Investigadores : los investigadores se centran en el desarrollo y la evaluación de la eficacia de las técnicas de minería de datos. [9] Una conferencia internacional anual para investigadores comenzó en 2008, seguida por el establecimiento de la Revista de Minería de Datos Educativos en 2009. La amplia gama de temas en EDM abarca desde el uso de la minería de datos para mejorar la efectividad institucional hasta el desempeño de los estudiantes.
- Administradores : los administradores son responsables de asignar los recursos para la implementación en las instituciones. [9] A medida que las instituciones son cada vez más responsables del éxito de los estudiantes, la administración de aplicaciones EDM se está volviendo más común en entornos educativos. Los profesores y los asesores se están volviendo más proactivos a la hora de identificar y abordar a los estudiantes en riesgo. Sin embargo, a veces es un desafío hacer llegar la información a los tomadores de decisiones para que administren la aplicación de manera oportuna y eficiente.
Etapas
A medida que la investigación en el campo de la minería de datos educativos ha seguido creciendo, se han aplicado una gran variedad de técnicas de minería de datos a una variedad de contextos educativos. En cada caso, el objetivo es traducir los datos sin procesar en información significativa sobre el proceso de aprendizaje para poder tomar mejores decisiones sobre el diseño y la trayectoria de un entorno de aprendizaje. Por tanto, la electroerosión consta generalmente de cuatro fases: [2] [5]
- La primera fase del proceso de EDM (sin contar el preprocesamiento ) es descubrir relaciones en los datos. Esto implica buscar en un repositorio de datos de un entorno educativo con el objetivo de encontrar relaciones consistentes entre variables . Se han utilizado varios algoritmos para identificar tales relaciones, que incluyen clasificación , regresión , agrupamiento , análisis de factores , análisis de redes sociales , minería de reglas de asociación y minería de patrones secuenciales .
- Las relaciones descubiertas deben validarse para evitar el sobreajuste .
- Se aplican relaciones validadas para hacer predicciones sobre eventos futuros en el entorno de aprendizaje.
- Las predicciones se utilizan para respaldar los procesos de toma de decisiones y las decisiones políticas.
Durante las fases 3 y 4, los datos a menudo se visualizan o de alguna otra manera se destilan para el juicio humano. [2] Se ha realizado una gran cantidad de investigación sobre las mejores prácticas para visualizar datos .
Enfoques principales
De las categorías generales de métodos mencionados, la predicción , la agrupación en clústeres y la minería de relaciones se consideran métodos universales en todos los tipos de minería de datos; sin embargo, el descubrimiento con modelos y la destilación de datos para el juicio humano se consideran enfoques más destacados dentro de la minería de datos educativos. [7]
Descubrimiento con modelos
En el método Discovery with Model, un modelo se desarrolla a través de la predicción, la agrupación o mediante la ingeniería del conocimiento del razonamiento humano y luego se utiliza como un componente en otro análisis, es decir, en la predicción y la minería de relaciones. [7] En el uso del método de predicción , las predicciones del modelo creado se utilizan para predecir una nueva variable . [7] Para el uso de la minería de relaciones , el modelo creado permite el análisis entre nuevas predicciones y variables adicionales en el estudio. [7] En muchos casos, el descubrimiento con modelos utiliza modelos de predicción validados que han demostrado su generalización en todos los contextos.
Las aplicaciones clave de este método incluyen el descubrimiento de relaciones entre los comportamientos, características y variables contextuales de los estudiantes en el entorno de aprendizaje. [7] También se puede explorar un mayor descubrimiento de preguntas de investigación amplias y específicas en una amplia gama de contextos utilizando este método.
Destilación de datos para juicio humano
Los seres humanos pueden hacer inferencias sobre datos que pueden estar más allá del alcance que proporciona un método automatizado de minería de datos . [7] Para el uso de la minería de datos educativos, los datos se destilan para el juicio humano con dos propósitos clave, identificación y clasificación . [7]
A los efectos de la identificación , los datos se destilan para permitir que los humanos identifiquen patrones bien conocidos, que de otro modo podrían ser difíciles de interpretar. Por ejemplo, la curva de aprendizaje , clásica de los estudios educativos, es un patrón que refleja claramente la relación entre el aprendizaje y la experiencia a lo largo del tiempo.
Los datos también se destilan con el fin de clasificar las características de los datos, que para la minería de datos educativos se utilizan para respaldar el desarrollo del modelo de predicción. La clasificación ayuda a acelerar enormemente el desarrollo del modelo de predicción.
El objetivo de este método es resumir y presentar la información de una manera útil, interactiva y visualmente atractiva para comprender la gran cantidad de datos educativos y respaldar la toma de decisiones . [9] En particular, este método es beneficioso para que los educadores comprendan la información de uso y la efectividad en las actividades del curso. [9] Las aplicaciones clave para la destilación de datos para el juicio humano incluyen la identificación de patrones en el aprendizaje, comportamiento, oportunidades de colaboración y etiquetado de datos de los estudiantes para usos futuros en modelos de predicción. [7]
Aplicaciones
Cristóbal Romero y Sebastián Ventura proporcionan una lista de las principales aplicaciones de la electroerosión. [5] En su taxonomía, las áreas de aplicación de EDM son:
- Análisis y visualización de datos
- Proporcionar comentarios para los instructores de apoyo
- Recomendaciones para estudiantes
- Predecir el desempeño de los estudiantes
- Modelado de estudiantes
- Detectar comportamientos indeseables de los estudiantes
- Agrupación de estudiantes
- Análisis de redes sociales
- Desarrollar mapas conceptuales
- Construcción de material didáctico: EDM se puede aplicar a sistemas de gestión de cursos como Moodle de código abierto . Moodle contiene datos de uso que incluyen diversas actividades de los usuarios, como resultados de pruebas, cantidad de lecturas completadas y participación en foros de discusión . Las herramientas de minería de datos se pueden utilizar para personalizar las actividades de aprendizaje para cada usuario y adaptar el ritmo en el que el estudiante completa el curso. Esto es particularmente beneficioso para los cursos en línea con diferentes niveles de competencia.
- Planificación y programación
Una nueva investigación sobre entornos de aprendizaje móvil también sugiere que la minería de datos puede ser útil. La minería de datos se puede utilizar para ayudar a proporcionar contenido personalizado a los usuarios móviles, a pesar de las diferencias en la gestión de contenido entre los dispositivos móviles y las PC estándar y los navegadores web .
Las nuevas aplicaciones de EDM se centrarán en permitir que los usuarios no técnicos utilicen y participen en actividades y herramientas de minería de datos, haciendo que la recopilación y el procesamiento de datos sean más accesibles para todos los usuarios de EDM. Los ejemplos incluyen herramientas estadísticas y de visualización que analizan las redes sociales y su influencia en los resultados del aprendizaje y la productividad. [14]
Cursos
- En octubre de 2013, Coursera ofreció un curso en línea gratuito sobre "Big Data en la educación" que enseñó cómo y cuándo usar métodos clave para EDM. [15] Este curso se trasladó a edX en el verano de 2015, [16] y ha continuado ejecutándose en edX anualmente desde entonces. Un archivo de cursos ahora está disponible en línea. [17]
- Teachers College, Columbia University ofrece una maestría en análisis de aprendizaje. [18]
Lugares de publicación
Se publican cantidades considerables de trabajo de EDM en la Conferencia Internacional sobre Minería de Datos Educativos revisada por pares, organizada por la Sociedad Internacional de Minería de Datos Educativos .
- Primera Conferencia Internacional sobre Minería de Datos Educativos (2008) - Montreal, Canadá
- 2do Congreso Internacional de Minería de Datos Educativos (2009) - Córdoba, España
- Tercera Conferencia Internacional sobre Minería de Datos Educativos (2010) - Pittsburgh, PA, EE. UU.
- 4a Conferencia Internacional sobre Minería de Datos Educativos (2011) - Eindhoven, Países Bajos
- Quinta Conferencia Internacional sobre Minería de Datos Educativos (2012) - Chania, Grecia
- 6ta Conferencia Internacional sobre Minería de Datos Educativos (2013) - Memphis, TN, EE. UU.
- 7th International Conference on Educational Data Mining (2014) - Londres, Reino Unido
- VIII Congreso Internacional de Minería de Datos Educativos (2015) - Madrid, España
- Novena Conferencia Internacional sobre Minería de Datos Educativos (2016) - Raleigh, NC, EE. UU.
- Décima Conferencia Internacional sobre Minería de Datos Educativos (2017) - Wuhan, China
- XI Conferencia Internacional sobre Minería de Datos Educativos (2018) - Buffalo, NY, EE. UU.
- 12a Conferencia Internacional sobre Minería de Datos Educativos (2019) - Montreal, QC, Canadá
- 13 ° Congreso Internacional sobre Minería de Datos Educativos (2020) - Virtual
- XIV Conferencia Internacional sobre Minería de Datos Educativos (2020) - París, Francia
Los artículos de EDM también se publican en el Journal of Educational Data Mining (JEDM).
Muchos artículos de EDM se publican de forma rutinaria en conferencias relacionadas, como Inteligencia Artificial y Educación, Sistemas de Tutoría Inteligente y Modelado, Adaptación y Personalización de Usuarios .
En 2011, Chapman & Hall / CRC Press , Taylor y Francis Group publicaron el primer Manual de minería de datos educativos. Este recurso fue creado para aquellos que estén interesados en participar en la comunidad educativa de minería de datos. [14]
Concursos
En 2010, la Association for Computing Machinery 's KDD Copa se llevó a cabo utilizando datos de un entorno educativo. El conjunto de datos fue proporcionado por el DataShop del Centro de Ciencias del Aprendizaje de Pittsburgh , y consistía en más de 1,000,000 de puntos de datos de estudiantes que usaban un tutor cognitivo . Seiscientos equipos compitieron por más de 8.000 USD en premios (que fueron donados por Facebook ). El objetivo de los concursantes era diseñar un algoritmo que, después de aprender de los datos proporcionados, hiciera las predicciones más precisas a partir de nuevos datos. Los ganadores presentaron un algoritmo que utiliza la generación de características (una forma de aprendizaje de representación ), bosques aleatorios y redes bayesianas .
Costos y desafíos
Junto con los avances tecnológicos, están los costos y desafíos asociados con la implementación de aplicaciones EDM. Estos incluyen los costos para almacenar los datos registrados y el costo asociado con la contratación de personal dedicado a administrar los sistemas de datos. [19] Además, es posible que los sistemas de datos no siempre se integren perfectamente entre sí e incluso con el apoyo de herramientas estadísticas y de visualización, crear una versión simplificada de los datos puede resultar difícil. [19] Además, elegir qué datos extraer y analizar también puede ser un desafío, [19] haciendo que las etapas iniciales consuman mucho tiempo y trabajo. De principio a fin, la estrategia e implementación de EDM requiere que se mantenga la privacidad y la ética [19] para todas las partes interesadas involucradas.
Criticas
- Generalizabilidad : la investigación en EDM puede ser específica para el entorno educativo particular y el momento en el que se realizó la investigación y, como tal, puede no ser generalizable a otras instituciones. La investigación también indica que el campo de la minería de datos educativos se concentra en los países y culturas occidentales y , posteriormente, es posible que otros países y culturas no estén representados en la investigación y los hallazgos. [8] El desarrollo de modelos futuros debe considerar aplicaciones en múltiples contextos.
- Privacidad : la privacidad individual es una preocupación constante para la aplicación de herramientas de minería de datos. Con herramientas gratuitas, accesibles y fáciles de usar en el mercado, los estudiantes y sus familias pueden estar en riesgo de la información que los estudiantes brindan al sistema de aprendizaje, con la esperanza de recibir comentarios que beneficiarán su desempeño futuro. A medida que los usuarios adquieren conocimientos sobre la privacidad en línea , los administradores de herramientas de minería de datos educativos deben ser proactivos en la protección de la privacidad de sus usuarios y ser transparentes sobre cómo y con quién se utilizará y compartirá la información. El desarrollo de herramientas de electroerosión debe considerar la protección de la privacidad individual mientras se avanza en la investigación en este campo.
- Plagio : la detección de plagio es un desafío continuo para los educadores y profesores, ya sea en el aula o en línea. Sin embargo, debido a las complejidades asociadas con la detección y prevención del plagio digital en particular, las herramientas de minería de datos educativos no son lo suficientemente sofisticadas actualmente para abordar este problema con precisión. Por lo tanto, el desarrollo de la capacidad predictiva en cuestiones relacionadas con el plagio debería ser un área de enfoque en la investigación futura.
- Adopción : se desconoce qué tan generalizada está la adopción de EDM y hasta qué punto las instituciones han aplicado y considerado implementar una estrategia de EDM. Como tal, no está claro si existen barreras que impidan a los usuarios adoptar EDM en sus entornos educativos.
Ver también
- Big data
- Procesamiento de datos
- Educación
- Tecnologia Educacional
- Glosario de términos educativos
- Analítica de aprendizaje
- Aprendizaje automático
- Estadísticas
Referencias
- ^ "EducationalDataMining.org" . 2013 . Consultado el 15 de julio de 2013 .
- ^ a b c R. Baker (2010) Minería de datos para la educación. En McGaw, B., Peterson, P., Baker, E. (Eds.) International Encyclopedia of Education (3ª edición), vol. 7, págs. 112-118. Oxford, Reino Unido: Elsevier.
- ^ G. Siemens, RSjd Baker (2012). "Analítica de aprendizaje y minería de datos educativos: hacia la comunicación y la colaboración". Actas de la 2ª Conferencia Internacional sobre Análisis y Conocimiento del Aprendizaje : 252–254.
- ^ "educationdatamining.org" . Consultado el 14 de noviembre de 2020 .
- ↑ a b c C. Romero, S. Ventura. Minería de datos educativos: una revisión del estado del arte. Transacciones IEEE sobre sistemas, hombre y cibernética, Parte C: Aplicaciones y revisiones. 40 ( 6 ), 601-618, 2010.
- ^ " http://educationaldatamining.org/EDM2008/ " Consultado el 4 de septiembre de 2013
- ^ a b c d e f g h yo Baker, Ryan. "Minería de datos para la educación" (PDF) . oxford, Reino Unido: Elsevier . Consultado el 9 de febrero de 2014 .
- ^ a b Baker, RS; Yacef, K (2009). "El estado de la minería de datos educativos en 2009: una revisión y visiones de futuro". JEDM-Journal of Educational Data Mining . 1 (1): 2017.
- ^ a b c d e f Romero, Cristóbal; Ventura, Sebastian (enero-febrero de 2013). "Descubrimiento de conocimientos de minería de datos de WIREs". Revisiones interdisciplinarias de Wiley: minería de datos y descubrimiento de conocimientos . 3 (1): 12-27. doi : 10.1002 / widm.1075 . S2CID 18019486 .
- ^ Romero, Cristóbal; Ventura, Sebastián (2007). "Minería de datos educativos: una encuesta de 1995 a 2005". Sistemas expertos con aplicaciones . 33 (1): 135-146. doi : 10.1016 / j.eswa.2006.04.005 .
- ^ "Evaluación del impacto económico de la reforma del derecho de autor en el ámbito del aprendizaje mejorado por la tecnología" . Industry Canada. Archivado desde el original el 13 de abril de 2014 . Consultado el 6 de abril de 2014 .
- ^ Azarnoush, Bahareh, et al. "Hacia un marco para la segmentación de alumnos". JEDM-Journal of Educational Data Mining 5.2 (2013): 102-126.
- ^ a b Departamento de Educación de EE. UU., Oficina de Tecnología Educativa. "Mejora de la enseñanza y el aprendizaje a través de la minería de datos educativos y el análisis del aprendizaje: un resumen temático" (PDF) . Archivado desde el original (PDF) el 11 de junio de 2014 . Consultado el 30 de marzo de 2014 .
- ^ a b Romero, C .; Ventura, S .; Pechenizkiy, M .; Baker, RS (2010). Manual de minería de datos educativos . Prensa CRC.
- ^ "Big Data en la educación" . Coursera . Consultado el 30 de marzo de 2014 .
- ^ "Big Data en la educación" . edXedxed . Consultado el 13 de octubre de 2015 .
- ^ "Big Data en la educación" . Consultado el 17 de julio de 2018 .
- ^ "Análisis de aprendizaje | Teachers College de la Universidad de Columbia" . www.tc.columbia.edu . Consultado el 13 de octubre de 2015 .
- ^ a b c d "¿Cómo pueden la minería de datos educativos y el análisis del aprendizaje mejorar y personalizar la educación?" . EdTechReview . Consultado el 9 de abril de 2014 .