Offline Multi Agent Reinforcement Learning

Offline multi-agent reinforcement learning (MARL) focuses on training multiple agents to cooperate or compete using only pre-collected data, eliminating the need for costly or risky real-time interaction. Current research emphasizes addressing the challenges of distributional shift (where the learned policy differs from the data-generating policy) and the high-dimensional joint action space, often employing techniques like value decomposition, stationary distribution regularization, and diffusion models to improve performance and stability. This field is crucial for deploying MARL in real-world applications where online learning is impractical, impacting diverse areas such as robotics, game playing, and resource management. Standardization of datasets and evaluation methods is a growing focus to ensure reliable progress and comparison of algorithms.

29papers

Papers

May 9, 2025

Offline Multi-agent Reinforcement Learning via Score Decomposition
Dan Qiao, Wenhao Li, Shanchao Yang, Hongyuan Zha, Baoxiang Wang
The Chinese Univerisity of Hong Kong Shen Zhen●Tongji University
Multi Agent Coordination Multi Agent Reinforcement Learning Action Free Offline Cooperative Multi Agent System Offline Multi Agent Reinforcement Learning Score Distillation

March 1, 2025

Echo: Efficient Co-Scheduling of Hybrid Online-Offline Tasks for Large Language Model Serving
Zhibin Wang, Shipeng Li, Xue Li, Yuhang Zhou, Zhonghui Zhang, Zibo Wang, Rong Gu, Chen Tian, Kun Yang, Sheng Zhong
Offline Multi Agent Reinforcement Learning Language Model Action Free Offline

February 16, 2025

Scalable Multi-Agent Offline Reinforcement Learning and the Role of Information
Riccardo Zamboni, Enrico Brunetti, Marcello Restelli
Offline Multi Agent Reinforcement Learning Full Information Offline Reinforcement Learning Multi Agent Reinforcement Learning Fitted Q Iteration Integral Role

January 27, 2025

Multi-Agent Meta-Offline Reinforcement Learning for Timely UAV Path Planning and Data Collection
Eslam Eldeeb, Hirley Alves
Offline Multi Agent Reinforcement Learning Multi Agent Reinforcement Learning Q Learning Task Planning Data Collection

January 22, 2025

An Offline Multi-Agent Reinforcement Learning Framework for Radio Resource Management
Eslam Eldeeb, Hirley Alves
Offline Multi Agent Reinforcement Learning Radio Source Radio Resource Management Resource Management Action Free Offline

January 15, 2025

HyGen: Efficient LLM Serving via Elastic Online-Offline Request Co-location
Ting Sun, Penghan Wang, Fan Lai
Offline Adaptation Offline Multi Agent Reinforcement Learning Efficient LLM Latency Predictor Online Scheduling Latency Critical

October 2, 2024

ComaDICE: Offline Cooperative Multi-Agent Reinforcement Learning with Stationary Distribution Shift Regularization
The Viet Bui, Thanh Hong Nguyen, Tien Mai
Offline Reinforcement Learning Multi Agent Multi Agent Reinforcement Learning Action Free Offline Agent Training Offline Multi Agent Reinforcement Learning Multi Agent MuJoCo

October 1, 2024

Exploiting Structure in Offline Multi-Agent RL: The Benefits of Low Interaction Rank
Wenhao Zhan, Scott Fujimoto, Zheqing Zhu, Jason D. Lee, Daniel R. Jiang, Yonathan Efroni
Multi Agent Offline Multi Agent Reinforcement Learning Low Priority Efficient Learning Complementary Benefit

September 18, 2024

Putting Data at the Centre of Offline Multi-Agent Reinforcement Learning
Claude Formanek, Louise Beyers, Callum Rhys Tilbury, Jonathan P. Shock, Arnu Pretorius
Multi Agent Reinforcement Learning Center Voting Offline Multi Agent Reinforcement Learning Novel Dataset Action Free Offline Multi Agent System

August 23, 2024

Diffusion-based Episodes Augmentation for Offline Multi-Agent Reinforcement Learning
Jihwan Oh, Sungnyun Kim, Gahee Kim, Sunghwan Kim, Se-Young Yun
Multi Agent Reinforcement Learning Action Free Offline Time Series Offline Multi Agent Reinforcement Learning

August 20, 2024

Hokoff: Real Game Dataset from Honor of Kings and its Offline Reinforcement Learning Benchmarks
Yun Qu, Boyuan Wang, Jianzhun Shao, Yuhang Jiang, Chen Chen, Zhenbin Ye, Lin Liu, Junfeng Yang, Lin Lai, Hongyang Qin, Minwen Deng+7
Offline Reinforcement Learning Offline Multi Agent Reinforcement Learning

June 30, 2024

Diffusion Models for Offline Multi-agent Reinforcement Learning with Safety Constraints
Jianuo Huang
Offline Multi Agent Reinforcement Learning Multi Agent Reinforcement Learning Multiple Agent Safety Constraint Diffusion Model

June 13, 2024

Dispelling the Mirage of Progress in Offline MARL through Standardised Baselines and Evaluation
Claude Formanek, Callum Rhys Tilbury, Louise Beyers, Jonathan Shock, Arnu Pretorius
Multi Agent Reinforcement Learning Offline Multi Agent Reinforcement Learning Efficient Baseline Effective Baseline Action Free Offline Much Progress Global Evaluation

May 9, 2024

Federated Combinatorial Multi-Agent Multi-Armed Bandits
Fares Fourati, Mohamed-Slim Alouini, Vaneet Aggarwal
Submodular Maximization Offline Multi Agent Reinforcement Learning Online Combinatorial Bandit Feedback Multi Agent Multi Armed Bandit

February 29, 2024

Offline Fictitious Self-Play for Competitive Games
Jingxiao Chen, Weiji Xie, Weinan Zhang, Yong yu, Ying Wen
Offline Reinforcement Learning Offline Multi Agent Reinforcement Learning Fictitious Self Play Action Free Offline

December 6, 2023

MACCA: Offline Multi-agent Reinforcement Learning with Causal Credit Assignment
Ziyan Wang, Yali Du, Yudi Zhang, Meng Fang, Biwei Huang
Credit Assignment Causal Structure Offline Multi Agent Reinforcement Learning Individual Agent

November 3, 2023

AlberDICE: Addressing Out-Of-Distribution Joint Actions in Offline Multi-Agent RL via Alternating Stationary Distribution Correction Estimation
Daiki E. Matsunaga, Jongmin Lee, Jaeseok Yoon, Stefanos Leonardos, Pieter Abbeel, Kee-Eung Kim
Offline Multi Agent Reinforcement Learning DIstribution Estimation Distribution State Offline Reinforcement Learning

October 11, 2023

Accountability in Offline Reinforcement Learning: Explaining Decisions with a Corpus of Examples
Hao Sun, Alihan Hüyük, Daniel Jarrett, Mihaela van der Schaar
Offline Reinforcement Learning Offline Dataset Offline Multi Agent Reinforcement Learning Large Corpus Fewer Example Decision Relevant Information

September 22, 2023

Counterfactual Conservative Q Learning for Offline Multi-agent Reinforcement Learning
Jianzhun Shao, Yun Qu, Chen Chen, Hongchang Zhang, Xiangyang Ji
Offline Multi Agent Reinforcement Learning Conservative Value Estimation Conservative Q Learning Multi Agent Reinforcement Learning

July 21, 2023

Offline Multi-Agent Reinforcement Learning with Implicit Global-to-Local Value Regularization
Xiangsen Wang, Haoran Xu, Yinan Zheng, Xianyuan Zhan
Multi Agent MuJoCo Offline Policy Multi Agent Offline Reinforcement Learning Offline Multi Agent Reinforcement Learning Action Free Offline Multi Agent Reinforcement Learning Implicit Regularization

Offline Multi Agent Reinforcement Learning

Papers

Offline Multi-agent Reinforcement Learning via Score Decomposition

Echo: Efficient Co-Scheduling of Hybrid Online-Offline Tasks for Large Language Model Serving

Scalable Multi-Agent Offline Reinforcement Learning and the Role of Information

Multi-Agent Meta-Offline Reinforcement Learning for Timely UAV Path Planning and Data Collection

An Offline Multi-Agent Reinforcement Learning Framework for Radio Resource Management

HyGen: Efficient LLM Serving via Elastic Online-Offline Request Co-location

ComaDICE: Offline Cooperative Multi-Agent Reinforcement Learning with Stationary Distribution Shift Regularization

Exploiting Structure in Offline Multi-Agent RL: The Benefits of Low Interaction Rank

Putting Data at the Centre of Offline Multi-Agent Reinforcement Learning

Diffusion-based Episodes Augmentation for Offline Multi-Agent Reinforcement Learning

Hokoff: Real Game Dataset from Honor of Kings and its Offline Reinforcement Learning Benchmarks

Diffusion Models for Offline Multi-agent Reinforcement Learning with Safety Constraints

Dispelling the Mirage of Progress in Offline MARL through Standardised Baselines and Evaluation

Federated Combinatorial Multi-Agent Multi-Armed Bandits

Offline Fictitious Self-Play for Competitive Games

MACCA: Offline Multi-agent Reinforcement Learning with Causal Credit Assignment

AlberDICE: Addressing Out-Of-Distribution Joint Actions in Offline Multi-Agent RL via Alternating Stationary Distribution Correction Estimation

Accountability in Offline Reinforcement Learning: Explaining Decisions with a Corpus of Examples

Counterfactual Conservative Q Learning for Offline Multi-agent Reinforcement Learning

Offline Multi-Agent Reinforcement Learning with Implicit Global-to-Local Value Regularization