Planificación reactiva

En inteligencia artificial , la planificación reactiva denota un conjunto de técnicas para la selección de acciones por parte de agentes autónomos . Estas técnicas difieren de la planificación clásica en dos aspectos. Primero, operan de manera oportuna y, por lo tanto, pueden hacer frente a entornos altamente dinámicos e impredecibles . En segundo lugar, calculan solo una acción siguiente en cada instante, según el contexto actual. Los planificadores reactivos a menudo (pero no siempre) aprovechan los planes reactivos , que son estructuras almacenadas que describen las prioridades y el comportamiento del agente. El término planificación reactiva se remonta al menos a 1988 y es sinónimo del término más modernoplanificación dinámica .

Hay varias formas de representar un plan reactivo. Todos requieren una unidad de representación básica y un medio para componer estas unidades en planes.

Una regla de acción de condición, o regla si-entonces, es una regla en la forma: si condición entonces acción . Estas reglas se llaman producciones . El significado de la regla es el siguiente: si la condición se cumple, realiza la acción. La acción puede ser externa (p. ej., recoger algo y moverlo) o interna (p. ej., escribir un hecho en la memoria interna o evaluar un nuevo conjunto de reglas). Las condiciones normalmente son booleanas y la acción puede realizarse o no.

Las reglas de producción pueden estar organizadas en estructuras relativamente planas, pero más a menudo están organizadas en algún tipo de jerarquía . Por ejemplo, la arquitectura de subsunción consta de capas de comportamientos interconectados , cada uno de los cuales es una máquina de estados finitos que actúa en respuesta a una entrada adecuada. Luego, estas capas se organizan en una pila simple, con las capas superiores subsumiendo los objetivos de las inferiores. Otros sistemas pueden usar árboles, o puede incluir mecanismos especiales para cambiar qué subconjunto de reglas/objetivos es actualmente más importante. Las estructuras planas son relativamente fáciles de construir, pero solo permiten la descripción de un comportamiento simple o requieren condiciones inmensamente complicadas para compensar la falta de estructura.

Una parte importante de cualquier algoritmo de selección de acciones distribuidas es un mecanismo de resolución de conflictos. Este es un mecanismo para resolver conflictos entre acciones propuestas cuando se cumple más de una condición de reglas en un instante dado. El conflicto se puede resolver, por ejemplo,

Los sistemas expertos a menudo usan otras heurísticas más simples , como la actualidad, para seleccionar reglas, pero es difícil garantizar un buen comportamiento en un sistema grande con enfoques simples.