Multi Agent Actor Critic

Multi-agent actor-critic (MAAC) methods are a class of reinforcement learning algorithms designed to enable coordinated behavior among multiple agents interacting within a shared environment. Current research focuses on improving the scalability and efficiency of MAAC, addressing challenges like high variance in gradient estimates and the need for efficient communication and coordination, often employing techniques like centralized training with decentralized execution and incorporating attention mechanisms or transformer architectures. These advancements are driving progress in diverse applications, including traffic control, power grid management, and robotic manipulation, where the ability to learn effective cooperative strategies in complex, multi-agent systems is crucial.

Papers

June 8, 2022

Stabilizing Voltage in Power Distribution Networks via Multi-Agent Reinforcement Learning with Transformer
Minrui Wang, Mingxiao Feng, Wengang Zhou, Houqiang Li
Transformer Based Multi Agent Reinforcement Learning Transformer Based Model Multi Agent Actor Critic Power Network Voltage Control

April 12, 2022

Multi-agent Actor-Critic with Time Dynamical Opponent Model
Yuan Tian, Klaus-Rudolf Kladny, Qin Wang, Zhiwu Huang, Olga Fink
Multi Agent Reinforcement Learning Opponent Modeling Multi Agent Actor Critic Multi Agent Particle

March 15, 2022

Differentiable Multi-Agent Actor-Critic for Multi-Step Radiology Report Summarization
Sanjeev Kumar Karn, Ning Liu, Hinrich Schuetze, Oladimeji Farri
Text Summarization Abstractive Summarization Radiology Report Multi Agent Actor Critic Radiology Report Summarization

May 24, 2017

Counterfactual Multi-Agent Policy Gradients
Jakob Foerster, Gregory Farquhar, Triantafyllos Afouras, Nantas Nardelli, Shimon Whiteson
Credit Assignment Multi Agent Policy Cooperative Multi Agent System Multi Agent Actor Critic

Multi Agent Actor Critic

Papers

Stabilizing Voltage in Power Distribution Networks via Multi-Agent Reinforcement Learning with Transformer

Multi-agent Actor-Critic with Time Dynamical Opponent Model

Differentiable Multi-Agent Actor-Critic for Multi-Step Radiology Report Summarization

Counterfactual Multi-Agent Policy Gradients