Selección de "el ganador se lo lleva todo en acción"


El ganador se lo lleva todo es unconcepto informático que se ha aplicado ampliamente en la robótica basada en el comportamiento como método de selección de acciones para agentes inteligentes . Los sistemas "el ganador se lo lleva todo" funcionan conectando módulos (áreas designadas para tareas) de tal manera que cuando se realiza una acción, se detiene el resto de las acciones, por lo que solo ocurre una acción a la vez. El nombre proviene de la idea de que la acción "ganadora" consume toda la potencia del sistema motor. [1] [2] [3]

En las décadas de 1980 y 1990, muchos especialistas en robótica y científicos cognitivos intentaban encontrar alternativas más rápidas y eficientes al método tradicional de selección de acciones de modelado del mundo. [4] En 1982 , Jerome A. Feldman y DH Ballard publicaron los " Modelos conexionistas y sus propiedades", haciendo referencia y explicando que el ganador se lo lleva todo como un método de selección de acciones. La arquitectura de Feldman funcionaba con la regla simple de que en una red de módulos de acción interconectados, cada módulo establecerá su propia salida en cero si lee una entrada más alta que la suya en cualquier otro módulo. [5] En 1986 ,Rodney Brooks introdujo la inteligencia artificial basada en el comportamiento . [se necesita aclaración ] Las arquitecturas en las que el ganador se lo lleva todo para la selección de acciones pronto se convirtió en una característica común de los robots basados ​​en el comportamiento, porque la selección se produjo en el nivel de los módulos de acción (de abajo hacia arriba) en lugar de en un nivel cognitivo separado (de arriba hacia abajo ), produciendo un estrecho acoplamiento de estímulo y reacción. [6]

En la arquitectura jerárquica, las acciones o comportamientos se programan en una lista de prioridad alta a baja, con conexiones inhibitorias entre todos los módulos de acción. El agente realiza comportamientos de baja prioridad hasta que se estimula un comportamiento de mayor prioridad, momento en el que el comportamiento superior inhibe todos los demás comportamientos y se apodera del sistema motor por completo. Los comportamientos priorizados suelen ser clave para la supervivencia inmediata del agente, mientras que los comportamientos de menor prioridad son menos sensibles al tiempo. Por ejemplo, "huir del depredador" se clasificaría por encima de "dormir". [4] Si bien esta arquitectura permite una programación clara de los objetivos, muchos especialistas en robótica se han alejado de la jerarquía debido a su inflexibilidad. [7]

En la heterarquía y la arquitectura completamente distribuida, cada comportamiento tiene un conjunto de condiciones previas que deben cumplirse antes de que se pueda realizar, y un conjunto de condiciones posteriores que serán verdaderas después de que se haya realizado la acción. Estas condiciones previas y posteriores determinan el orden en el que se deben realizar los comportamientos y se utilizan para conectar causalmente los módulos de acción. Esto permite que cada módulo reciba entradas de otros módulos, así como de los sensores, de modo que los módulos puedan reclutarse entre sí. Por ejemplo, si el objetivo del agente fuera reducir la sed, la conducta "beber" requeriría la condición previa de tener agua disponible, por lo que el módulo activaría el módulo encargado de "buscar agua". Las activaciones organizan los comportamientos en una secuencia, aunque solo se realiza una acción a la vez.La distribución de comportamientos más amplios entre los módulos hace que este sistema sea flexible y resistente al ruido.[8] Algunos críticos de este modelo sostienen que cualquier conjunto existente de reglas de división para el predecesor y las conexiones conflictivas entre módulos producen una selección de acciones por debajo del nivel normal. Además, el circuito de retroalimentación utilizado en el modelo puede, en algunas circunstancias, llevar a una selección de acciones inadecuada. [9]