Aprendizaje multiagente

El aprendizaje de múltiples agentes es el uso del aprendizaje automático en un sistema de múltiples agentes . ^[1] Normalmente, los agentes mejoran sus decisiones a través de la experiencia. En particular, un agente debe aprender a coordinarse con los demás agentes.

Descripción general

Según un artículo de Shoham et al. en 2007, es difícil identificar todos los artículos relevantes en el dominio. ^[2] Existen algunas dificultades inherentes al aprendizaje por refuerzo profundo de múltiples agentes. ^[3] El entorno ya no es estacionario, por lo que se viola la propiedad de Markov : las transiciones y las recompensas no solo dependen del estado actual de un agente.

Referencias

^ Albrecht, Stefano; Stone, Peter (2017), "Aprendizaje multiagente: fundamentos y tendencias recientes. Tutorial", conferencia IJCAI-17 (PDF)
^ Shoham, Yoav; Poderes, Rob; Grenager, Trond (1 de mayo de 2007). "Si el aprendizaje de múltiples agentes es la respuesta, ¿cuál es la pregunta?" (PDF) . Inteligencia artificial . Fundamentos del aprendizaje de agentes múltiples. 171 (7): 365–377. doi : 10.1016 / j.artint.2006.02.006 . ISSN 0004-3702 .
^ Hernández-Leal, Pablo; Kartal, Bilal; Taylor, Matthew E. (1 de noviembre de 2019). "Una encuesta y crítica del aprendizaje por refuerzo profundo de múltiples agentes". Agentes autónomos y sistemas multiagente . 33 (6): 750–797. arXiv : 1810.05587 . doi : 10.1007 / s10458-019-09421-1 . ISSN 1573-7454 . S2CID 52981002 .

Este artículo relacionado con la inteligencia artificial es un esbozo . Puedes ayudar a Wikipedia expandiéndolo .

[1] Albrecht, Stefano; Stone, Peter (2017), "Aprendizaje multiagente: fundamentos y tendencias recientes. Tutorial", conferencia IJCAI-17 (PDF)

[2] Shoham, Yoav; Poderes, Rob; Grenager, Trond (1 de mayo de 2007). "Si el aprendizaje de múltiples agentes es la respuesta, ¿cuál es la pregunta?" (PDF) . Inteligencia artificial . Fundamentos del aprendizaje de agentes múltiples. 171 (7): 365–377. doi : 10.1016 / j.artint.2006.02.006 . ISSN 0004-3702 .

[3] Hernández-Leal, Pablo; Kartal, Bilal; Taylor, Matthew E. (1 de noviembre de 2019). "Una encuesta y crítica del aprendizaje por refuerzo profundo de múltiples agentes". Agentes autónomos y sistemas multiagente . 33 (6): 750–797. arXiv : 1810.05587 . doi : 10.1007 / s10458-019-09421-1 . ISSN 1573-7454 . S2CID 52981002 .

[1]