Multi Agent Proximal Policy Optimization

Multi-agent proximal policy optimization (MAPPO) is a deep reinforcement learning approach designed to train multiple agents to collaborate effectively on complex tasks. Current research focuses on improving MAPPO's performance and scalability through techniques like attention mechanisms for better credit assignment, graph neural networks for representing agent interactions, and incorporating intent sharing or communication protocols to enhance coordination. These advancements are driving significant improvements in various applications, including traffic control, robotics, and resource management in wireless networks, by enabling more efficient and robust decentralized control systems.

Papers

October 31, 2022

Safe and Efficient Manoeuvring for Emergency Vehicles in Autonomous Traffic using Multi-Agent Proximal Policy Optimisation
Leandro Parada, Eduardo Candela, Luis Marques, Panagiotis Angeloudis
Autonomous Vehicle Multi Agent Proximal Policy Optimization Autonomous Traffic Emergency Vehicle

June 6, 2022

Learning Generalized Wireless MAC Communication Protocols via Abstraction
Luciano Miuccio, Salvatore Riolo, Sumudu Samarakoon, Daniela Panno, Mehdi Bennis
Reinforcement Learning Cognitive Abstraction Multi Agent Proximal Policy Optimization Causal Abstraction Medium Access Control

May 24, 2022

Multi-Agent Collaborative Inference via DNN Decoupling: Intermediate Feature Compression and Edge Learning
Zhiwei Hao, Guanyu Xu, Yong Luo, Han Hu, Jianping An, Shiwen Mao
Inference Latency Feature Decoupling Edge Learning Collaborative Inference Energy Efficient Inference Feature Compression Multi Agent Proximal Policy Optimization

November 7, 2021

Coordinated Proximal Policy Optimization
Zifan Wu, Chao Yu, Deheng Ye, Junge Zhang, Haiyin Piao, Hankz Hankui Zhuo
Proximal Policy Optimization Policy Optimization Multi Agent Setting Multi Agent Proximal Policy Optimization Matrix Game

Multi Agent Proximal Policy Optimization

Papers

Safe and Efficient Manoeuvring for Emergency Vehicles in Autonomous Traffic using Multi-Agent Proximal Policy Optimisation

Learning Generalized Wireless MAC Communication Protocols via Abstraction

Multi-Agent Collaborative Inference via DNN Decoupling: Intermediate Feature Compression and Edge Learning

Coordinated Proximal Policy Optimization