El aprendizaje de múltiples agentes es el uso del aprendizaje automático en un sistema de múltiples agentes . [1] Normalmente, los agentes mejoran sus decisiones a través de la experiencia. En particular, un agente debe aprender a coordinarse con los demás agentes.
Descripción general
Según un artículo de Shoham et al. en 2007, es difícil identificar todos los artículos relevantes en el dominio. [2] Existen algunas dificultades inherentes al aprendizaje por refuerzo profundo de múltiples agentes. [3] El entorno ya no es estacionario, por lo que se viola la propiedad de Markov : las transiciones y las recompensas no solo dependen del estado actual de un agente.
Referencias
- ^ Albrecht, Stefano; Stone, Peter (2017), "Aprendizaje multiagente: fundamentos y tendencias recientes. Tutorial", conferencia IJCAI-17 (PDF)
- ^ Shoham, Yoav; Poderes, Rob; Grenager, Trond (1 de mayo de 2007). "Si el aprendizaje de múltiples agentes es la respuesta, ¿cuál es la pregunta?" (PDF) . Inteligencia artificial . Fundamentos del aprendizaje de agentes múltiples. 171 (7): 365–377. doi : 10.1016 / j.artint.2006.02.006 . ISSN 0004-3702 .
- ^ Hernández-Leal, Pablo; Kartal, Bilal; Taylor, Matthew E. (1 de noviembre de 2019). "Una encuesta y crítica del aprendizaje por refuerzo profundo de múltiples agentes". Agentes autónomos y sistemas multiagente . 33 (6): 750–797. arXiv : 1810.05587 . doi : 10.1007 / s10458-019-09421-1 . ISSN 1573-7454 . S2CID 52981002 .