Offline Data

Offline data in reinforcement learning (RL) focuses on training RL agents using pre-collected datasets, eliminating the need for costly online interaction with the environment. Current research emphasizes overcoming challenges like data bias and distribution shifts, employing techniques such as hierarchical RL, diffusion models, and metric learning to improve policy learning from diverse and potentially suboptimal offline data. This field is crucial for deploying RL in high-stakes applications like robotics and healthcare, where online exploration is impractical or unsafe, and advancements are driving progress in sample efficiency and robustness of RL algorithms.

Papers

October 2, 2023

Offline Tracking with Object Permanence
Xianzhong Liu, Holger Caesar
Autonomous Driving Offline Data 3D Multi Object Tracking Object Trajectory Object Permanence

August 24, 2023

Fall Detection using Knowledge Distillation Based Long short-term memory for Offline Embedded and Low Power Devices
Hannah Zhou, Allison Chen, Celine Buer, Emily Chen, Kayleen Tang, Lauryn Gong, Zhiqi Liu, Jianbin Tang
Knowledge Distillation Long Short Term Memory Low Power Fall Detection Offline Data Distillation Learning

August 15, 2023

Real Robot Challenge 2022: Learning Dexterous Manipulation from Offline Data in the Real World
Nico Gürtler, Felix Widmaier, Cansu Sancaktar, Sebastian Blaes, Pavel Kolev, Stefan Bauer, Manuel Wüthrich, Markus Wulfmeier, Martin Riedmiller, Arthur Allshire, Qiang Wang, Robert McCarthy, Hangyeol Kim, Jongchan Baek, Wookyong Kwon, Shanliang Qian, Yasunori Toshimitsu, Mike Yan Michelis, Amirhossein Kazemipour, Arman Raayatsanati, Hehui Zheng, Barnabas Gavin Cangan, Bernhard Schölkopf, Georg Martius
Offline Reinforcement Learning Real World Real Robot Dexterous Manipulation Offline Data Robotic Datasets Robot Challenge

August 11, 2023

Learning Control Policies for Variable Objectives from Offline Data
Marc Weber, Phillip Swazinna, Daniel Hein, Steffen Udluft, Volkmar Sterzing
Offline Reinforcement Learning Control Policy Offline Data Control Strategy Time Varying Objective Model Based Policy Optimization Target

July 10, 2023

Policy Finetuning in Reinforcement Learning via Design of Experiments using Offline Data
Ruiqi Zhang, Andrea Zanette
Reinforcement Learning Product Design Environment Exploration Optical Experiment Offline Data Provable Guarantee Diverse Policy Exploration Policy Policy Fine Tuning

June 15, 2023

Optimal Best-Arm Identification in Bandits with Access to Offline Data
Shubhada Agrawal, Sandeep Juneja, Karthikeyan Shanmugam, Arun Sai Suggala
Sample Complexity Online Learning Stochastic Way Sequential Learning Best Arm Identification Information Access Offline Data Armed Bandit

June 6, 2023

Stabilizing Contrastive RL: Techniques for Robotic Goal Reaching from Offline Data
Chongyi Zheng, Benjamin Eysenbach, Homer Walke, Patrick Yin, Kuan Fang, Ruslan Salakhutdinov, Sergey Levine
Reinforcement Learning Self Supervised Learning Self Supervised Barzilai Borwein Technique Offline Data Self Supervised Reinforcement Learning Robot Goal Contrastive Reinforcement Learning

May 24, 2023

Provable Offline Preference-Based Reinforcement Learning
Wenhao Zhan, Masatoshi Uehara, Nathan Kallus, Jason D. Lee, Wen Sun
Reinforcement Learning Offline Data Implicit Reward State Reward Single Policy Concentrability Offline Preference Based Reinforcement Learning

April 18, 2023

Using Offline Data to Speed Up Reinforcement Learning in Procedurally Generated Environments
Alain Andres, Lukas Schäfer, Stefano V.Albrecht, Javier Del Ser
Reinforcement Learning Imitation Learning Optimal Policy Environment Feature Offline Data Procedural Text Trajectory Generalization

February 6, 2023

Efficient Online Reinforcement Learning with Offline Data
Philip J. Ball, Laura Smith, Ilya Kostrikov, Sergey Levine
Policy Reinforcement Learning Optimal Trajectory Online Reinforcement Learning Efficient Reinforcement Learning Offline Data Synthetic Trajectory Based Exploration

November 24, 2022

November 20, 2022

DYNAFED: Tackling Client Data Heterogeneity with Global Dynamics
Renjie Pi, Weizhong Zhang, Yueqi Xie, Jiahui Gao, Xiaoyu Wang, Sunghun Kim, Qifeng Chen
Global Model Future Trajectory Offline Data World Dynamic Client Data Heterogeneity

November 9, 2022

Leveraging Offline Data in Online Reinforcement Learning
Andrew Wagenmaker, Aldo Pacchiano
Reinforcement Learning Offline Reinforcement Learning Optimal Policy Online Reinforcement Learning Offline Data Offline Dataset

November 8, 2022

ARMOR: A Model-based Framework for Improving Arbitrary Baseline Policies with Offline Data
Tengyang Xie, Mohak Bhardwaj, Nan Jiang, Ching-An Cheng
Offline Reinforcement Learning Offline Data Model Driven Adversarial Model Based Offline RL Baseline Policy

October 12, 2022

Generalization with Lossy Affordances: Leveraging Broad Offline Data for Learning Visuomotor Tasks
Kuan Fang, Patrick Yin, Ashvin Nair, Homer Walke, Gengchen Yan, Sergey Levine
Strong Generalization Offline Reinforcement Learning Affordance Learning Unseen Task Goal Conditioned Policy Offline Data Visuo Motor Control Novel Task

August 10, 2022

Robust Reinforcement Learning using Offline Data
Kishan Panaganti, Zaiyan Xu, Dileep Kalathil, Mohammad Ghavamzadeh
Robust Reinforcement Learning Offline Data Optimal Robust Policy

July 31, 2022

Robot Policy Learning from Demonstration Using Advantage Weighting and Early Termination
Abdalkarim Mohtasib, Gerhard Neumann, Heriberto Cuayahuitl
Reinforcement Learning Robotic Task Textual Demonstration Real Robot Offline Data Expert Trajectory Robot Policy Learning Early Termination

June 30, 2022

CoVaxNet: An Online-Offline Data Repository for COVID-19 Vaccine Hesitancy Research
Bohan Jiang, Paras Sheth, Baoxin Li, Huan Liu
Social Medium Offline Data COVID 19 Vaccine Vaccine Hesitancy 19 Dataset

April 8, 2022

Learning Cooperative Dynamic Manipulation Skills from Human Demonstration Videos
Francesco Iodice, Yuqiang Wu, Wansoo Kim, Fei Zhao, Elena De Momi, Arash Ajoudani
LeArning Abstract Human Demonstration Offline Data Serial Reproduction Collaborative Environment Collaborative Manipulation Stiffness Identification

Offline Data

Papers

Offline Tracking with Object Permanence

Fall Detection using Knowledge Distillation Based Long short-term memory for Offline Embedded and Low Power Devices

Real Robot Challenge 2022: Learning Dexterous Manipulation from Offline Data in the Real World

Learning Control Policies for Variable Objectives from Offline Data

Policy Finetuning in Reinforcement Learning via Design of Experiments using Offline Data

Optimal Best-Arm Identification in Bandits with Access to Offline Data

Stabilizing Contrastive RL: Techniques for Robotic Goal Reaching from Offline Data

Provable Offline Preference-Based Reinforcement Learning

Using Offline Data to Speed Up Reinforcement Learning in Procedurally Generated Environments

Efficient Online Reinforcement Learning with Offline Data

The Second-place Solution for ECCV 2022 Multiple People Tracking in Group Dance Challenge

The Second-place Solution for CVPR 2022 SoccerNet Tracking Challenge

DYNAFED: Tackling Client Data Heterogeneity with Global Dynamics

Leveraging Offline Data in Online Reinforcement Learning

ARMOR: A Model-based Framework for Improving Arbitrary Baseline Policies with Offline Data

Generalization with Lossy Affordances: Leveraging Broad Offline Data for Learning Visuomotor Tasks

Robust Reinforcement Learning using Offline Data

Robot Policy Learning from Demonstration Using Advantage Weighting and Early Termination

CoVaxNet: An Online-Offline Data Repository for COVID-19 Vaccine Hesitancy Research

Learning Cooperative Dynamic Manipulation Skills from Human Demonstration Videos