Action Free Offline

Action-free offline reinforcement learning (RL) focuses on training agents using pre-collected datasets that lack action information, aiming to improve policy learning efficiency and safety by minimizing or eliminating the need for real-time environment interaction. Current research emphasizes model-based and model-free approaches, including algorithms that leverage diffusion models, value function decomposition, and policy regularization techniques to address challenges like distributional shift and coordination failure in multi-agent settings. This field is significant because it enables the application of RL in scenarios where online interaction is impractical or risky, with potential impacts across robotics, resource management, and other domains requiring safe and efficient learning from limited data.

Papers

August 23, 2024

Diffusion-based Episodes Augmentation for Offline Multi-Agent Reinforcement Learning
Jihwan Oh, Sungnyun Kim, Gahee Kim, Sunghwan Kim, Se-Young Yun
Multi Agent Reinforcement Learning Time Series Action Free Offline Offline Multi Agent Reinforcement Learning

August 20, 2024

Offline Model-Based Reinforcement Learning with Anti-Exploration
Padmanaba Srinivasan, William Knottenbelt
Offline Reinforcement Learning Model Based Reinforcement Learning Action Free Offline

July 1, 2024

Coordination Failure in Cooperative Offline MARL
Callum Rhys Tilbury, Claude Formanek, Louise Beyers, Jonathan P. Shock, Arnu Pretorius
Multi Agent Reinforcement Learning Policy Learning Action Free Offline Multi Agent Policy Coordination Problem Multi Agent Optimal Control

June 13, 2024

Dispelling the Mirage of Progress in Offline MARL through Standardised Baselines and Evaluation
Claude Formanek, Callum Rhys Tilbury, Louise Beyers, Jonathan Shock, Arnu Pretorius
Multi Agent Reinforcement Learning Global Evaluation Much Progress Action Free Offline Offline Multi Agent Reinforcement Learning Effective Baseline Efficient Baseline

June 6, 2024

Offline Multi-Objective Optimization
Ke Xue, Rong-Xi Tan, Xiaobin Huang, Chao Qian
Multi Objective Optimization Objective Function Action Free Offline Offline Optimization

May 28, 2024

Offline Oracle-Efficient Learning for Contextual MDPs via Layerwise Exploration-Exploitation Tradeoff
Jian Qian, Haichen Hu, David Simchi-Levi
Contextual Bandit Action Free Offline Exploration Exploitation Trade Near Optimal Algorithm Reward Free Reinforcement Learning Contextual Markov Decision Process Contextual MDPs

May 8, 2024

April 16, 2024

Learning from Offline and Online Experiences: A Hybrid Adaptive Operator Selection Framework
Jiyuan Pei, Jialin Liu, Yi Mei
LeArning Abstract Action Free Offline Optimisation Problem Meta Heuristic Adaptive Decision Making Operator Selection Online Content

April 9, 2024

Training-Free Open-Vocabulary Segmentation with Offline Diffusion-Augmented Prototype Generation
Luca Barsellotti, Roberto Amoroso, Marcella Cornia, Lorenzo Baraldi, Rita Cucchiara
Semantic Segmentation Action Free Offline Open Vocabulary Semantic Segmentation Image Caption Pair Discriminative Region

February 29, 2024

Offline Fictitious Self-Play for Competitive Games
Jingxiao Chen, Weiji Xie, Weinan Zhang, Yong yu, Ying Wen
Offline Reinforcement Learning Action Free Offline Offline Multi Agent Reinforcement Learning Fictitious Self Play

February 19, 2024

The Edge-of-Reach Problem in Offline Model-Based Reinforcement Learning
Anya Sims, Cong Lu, Jakob Foerster, Yee Whye Teh
Offline Reinforcement Learning Model Based Reinforcement Learning Online Reinforcement Learning Action Free Offline Learned Dynamic Value Learning

February 8, 2024

Offline Actor-Critic Reinforcement Learning Scales to Large Models
Jost Tobias Springenberg, Abbas Abdolmaleki, Jingwei Zhang, Oliver Groth, Michael Bloesch, Thomas Lampe, Philemon Brakel, Sarah Bechtle, Steven Kapturowski, Roland Hafner, Nicolas Heess, Martin Riedmiller
Large Model Actor Critic Action Free Offline Suboptimal Demonstration

February 6, 2024

A Survey of Offline and Online Learning-Based Algorithms for Multirotor UAVs
Serhat Sönmez, Matthew J. Rutherford, Kimon P. Valavanis
Reinforcement Learning Timely Survey Machine Learning Algorithm Learning Algorithm Online Service Action Free Offline Quadrotor UAV

January 6, 2024

MOTO: Offline Pre-training to Online Fine-tuning for Model-based Robot Learning
Rafael Rafailov, Kyle Hatch, Victor Kolev, John D. Martin, Mariano Phielipp, Chelsea Finn
Reinforcement Learning Action Free Offline Online Fine Tuning Based Offline RL

December 4, 2023

Non-Intrusive Load Monitoring for Feeder-Level EV Charging Detection: Sliding Window-based Approaches to Offline and Online Detection
Cameron Martin, Fucai Ke, Hao Wang
Automatic Detection Action Free Offline Electric Vehicle Charging Non Intrusive Load Monitoring Historical Load

October 27, 2023

Approximate Heavy Tails in Offline (Multi-Pass) Stochastic Gradient Descent
Krunoslav Lehman Pavasovic, Alain Durmus, Umut Simsekli
Stochastic Gradient Descent Action Free Offline Heavy Tailed Heavy Tail Offline Training

October 12, 2023

Offline Retraining for Online RL: Decoupled Policy Learning to Mitigate Exploration Bias
Max Sobol Mark, Archit Sharma, Fahim Tajwar, Rafael Rafailov, Sergey Levine, Chelsea Finn
Reinforcement Learning Online Reinforcement Learning Action Free Offline Online Fine Tuning Exploration Bias

September 16, 2023

Unsupervised Green Object Tracker (GOT) without Offline Pre-training
Zhiruo Zhou, Suya You, C. -C. Jay Kuo
Visual Object Tracking Action Free Offline Single Object Tracking Object Tracker Unsupervised Visual Tracking

July 21, 2023

Offline Multi-Agent Reinforcement Learning with Implicit Global-to-Local Value Regularization
Xiangsen Wang, Haoran Xu, Yinan Zheng, Xianyuan Zhan
Multi Agent Reinforcement Learning Multi Agent Offline Reinforcement Learning Implicit Regularization Action Free Offline Offline Policy Offline Multi Agent Reinforcement Learning Multi Agent MuJoCo