Aprendizaje sin conexión

En el aprendizaje automático , los sistemas que emplean el aprendizaje fuera de línea no cambian su aproximación a la función objetivo cuando se completa la fase de entrenamiento inicial. ^{[ cita requerida ]} Estos sistemas también son típicamente ejemplos de aprendizaje ansioso . ^{[ cita requerida ]}

Mientras que en el aprendizaje en línea, solo se conoce el conjunto de elementos posibles, en el aprendizaje fuera de línea, el alumno conoce la identidad de los elementos, así como el orden en que se presentan. ^[1]

Aplicaciones para control robótico

La capacidad de los robots para aprender es igual a crear una tabla (información) que se llena de valores. Una opción para hacerlo es la programación mediante demostración . Aquí, la mesa está llena de valores por un maestro humano. La demostración se proporciona como una política de control numérico directo que es igual a una trayectoria, o como una función objetiva indirecta que se da de antemano. ^[2]

El aprendizaje sin conexión funciona en modo por lotes . En el paso 1, la tarea se demuestra y se almacena en la tabla, y en el paso 2, el robot reproduce la tarea. ^[3] El proceso es lento e ineficiente porque existe un retraso entre la demostración del comportamiento y la repetición de la habilidad. ^[4]^[5]

Un breve ejemplo ayudará a comprender la idea. Suponga que el robot debe aprender una tarea de seguimiento de pared y la mesa interna del robot está vacía. Antes de que el robot se active en el modo de reproducción, el demostrador humano debe enseñar el comportamiento. Él está controlando el robot con teleoperación y durante el paso de aprendizaje se genera la tabla de habilidades. El proceso se llama fuera de línea, porque el software de control del robot no hace nada, pero el operador humano utiliza el dispositivo como un dispositivo señalador para conducir a lo largo de la pared. ^[5]

Ver también

Aprendizaje en línea , el modelo opuesto
Aprendizaje incremental , un modelo de aprendizaje para la extensión incremental del conocimiento

Referencias

^ Ben-David, Shai; Kushilevitz, Eyal; Mansour, Yishay (1 de octubre de 1997). "Aprendizaje en línea versus aprendizaje fuera de línea" . Aprendizaje automático . 29 (1): 45–63. doi : 10.1023 / A: 1007465907571 . ISSN 0885-6125 .
^ Bajcsy, Andrea y Losey, Dylan P y O'Malley, Marcia K y Dragan, Anca D (2017). "Aprender los objetivos del robot a partir de la interacción física humana". Actas de la investigación sobre aprendizaje automático . PMLR. 78 : 217–226.CS1 maint: varios nombres: lista de autores ( enlace )
^ Meyer-Delius, Daniel y Beinhofer, Maximilian y Burgard, Wolfram (2012). Modelos de cuadrícula de ocupación para mapeo de robots en entornos cambiantes . XXVI Congreso AAAI sobre Inteligencia Artificial.CS1 maint: varios nombres: lista de autores ( enlace )
^ Luka Peternel y Erhan Oztop y Jan Babic (2016). Un método de control compartido para el aprendizaje de robots humanos en el circuito en línea basado en regresión ponderada localmente . 2016 IEEE / RSJ International Conference on Intelligent Robots and Systems (IROS). IEEE. doi : 10.1109 / iros.2016.7759574 .
^ ^a ^b Jun, Li y Duckett, Tom (2003). Aprendizaje del comportamiento del robot con una red RBF dinámicamente adaptativa: experimentos en el aprendizaje en línea y fuera de línea . Proc. 2 Pasante. Conf. en Computación. Inteligencia, Robótica y Sistema Autónomo, CIRAS. Citeseer.CS1 maint: varios nombres: lista de autores ( enlace )

Este artículo de informática es un esbozo . Puedes ayudar a Wikipedia expandiéndolo .

[1] Ben-David, Shai; Kushilevitz, Eyal; Mansour, Yishay (1 de octubre de 1997). "Aprendizaje en línea versus aprendizaje fuera de línea" . Aprendizaje automático . 29 (1): 45–63. doi : 10.1023 / A: 1007465907571 . ISSN 0885-6125 .

[2] Bajcsy, Andrea y Losey, Dylan P y O'Malley, Marcia K y Dragan, Anca D (2017). "Aprender los objetivos del robot a partir de la interacción física humana". Actas de la investigación sobre aprendizaje automático . PMLR. 78 : 217–226.CS1 maint: varios nombres: lista de autores ( enlace )

[3] Meyer-Delius, Daniel y Beinhofer, Maximilian y Burgard, Wolfram (2012). Modelos de cuadrícula de ocupación para mapeo de robots en entornos cambiantes . XXVI Congreso AAAI sobre Inteligencia Artificial.CS1 maint: varios nombres: lista de autores ( enlace )

[4] Luka Peternel y Erhan Oztop y Jan Babic (2016). Un método de control compartido para el aprendizaje de robots humanos en el circuito en línea basado en regresión ponderada localmente . 2016 IEEE / RSJ International Conference on Intelligent Robots and Systems (IROS). IEEE. doi : 10.1109 / iros.2016.7759574 .

[Jun2003-5] Jun, Li y Duckett, Tom (2003). Aprendizaje del comportamiento del robot con una red RBF dinámicamente adaptativa: experimentos en el aprendizaje en línea y fuera de línea . Proc. 2 Pasante. Conf. en Computación. Inteligencia, Robótica y Sistema Autónomo, CIRAS. Citeseer.CS1 maint: varios nombres: lista de autores ( enlace )

[1]