Empoderamiento (inteligencia artificial)


El empoderamiento en el campo de la inteligencia artificial formaliza y cuantifica (a través de la teoría de la información ) el potencial que percibe un agente que tiene para influir en su entorno. [1] [2] Un agente que sigue una política de maximización del empoderamiento, actúa para maximizar las opciones futuras (típicamente hasta un horizonte limitado). El empoderamiento se puede utilizar como una (pseudo) función de utilidad que depende únicamente de la información recopilada del entorno local para guiar la acción, en lugar de buscar un objetivo impuesto desde el exterior, por lo que es una forma de motivación intrínseca . [3]

El formalismo de empoderamiento depende de un modelo probabilístico comúnmente utilizado en inteligencia artificial. Un agente autónomo opera en el mundo tomando información sensorial y actuando para cambiar su estado, o el del ambiente, en un ciclo de percepción y acción conocido como bucle percepción-acción . El estado y las acciones del agente se modelan mediante variables aleatorias ( ) y tiempo ( ). La elección de la acción depende del estado actual, y el estado futuro depende de la elección de la acción, por lo que el bucle percepción-acción desplegado en el tiempo forma una red causal bayesiana .

El empoderamiento ( ) se define como la capacidad del canal ( ) del canal de actuación del agente, y se formaliza como el máximo flujo de información posible entre las acciones del agente y el efecto de esas acciones tiempo después. El empoderamiento se puede considerar como el potencial futuro del agente para afectar su entorno, medido por sus sensores. [3]

En un modelo de tiempo discreto, el empoderamiento se puede calcular para un número determinado de ciclos en el futuro, lo que en la literatura se denomina empoderamiento de 'n pasos'. [4]

La unidad de empoderamiento depende de la base del logaritmo. La base 2 se usa comúnmente, en cuyo caso la unidad es bits .

En general, la elección de la acción (distribución de la acción) que maximiza el empoderamiento varía de un estado a otro. Conocer el empoderamiento de un agente en un estado específico es útil, por ejemplo, para construir una política de maximización del empoderamiento. El empoderamiento específico del estado se puede encontrar usando el formalismo más general para 'empoderamiento contextual'. [4] es una variable aleatoria que describe el contexto (por ejemplo, el estado).