Preference Based Reinforcement Learning

Preference-based reinforcement learning (PbRL) aims to train agents by learning from human preferences over different behaviors, rather than relying on explicitly engineered reward functions. Current research focuses on improving the efficiency and robustness of PbRL, exploring techniques like multimodal transformers for richer preference modeling, incorporating equal preferences and skill-driven learning, and addressing noisy or limited feedback through methods such as dynamic sparsity and self-training. This approach holds significant promise for real-world applications where designing accurate reward functions is difficult or impossible, particularly in robotics and human-computer interaction, by enabling more natural and intuitive agent training.

Papers

December 21, 2023

Incorporating Human Flexibility through Reward Preferences in Human-AI Teaming
Siddhant Bhambri, Mudit Verma, Upasana Biswas, Anil Murthy, Subbarao Kambhampati
Preference Based Reinforcement Learning Human AI Cooperation

November 15, 2023

Pearl: Personalizing Large Language Model Writing Assistants with Generation-Calibrated Retrievers
Sheshera Mysore, Zhuoran Lu, Mengting Wan, Longqi Yang, Bahareh Sarrafzadeh, Steve Menezes, Tina Baghaee, Emmanuel Barajas Gonzalez, Jennifer Neville, Tara Safavi
Social Medium Preference Based Reinforcement Learning Historical Document Writing Assistant Retrieval Augmented LLM Personalized Generation

July 19, 2023

STRAPPER: Preference-based Reinforcement Learning via Self-training Augmentation and Peer Regularization
Yachen Kang, Li He, Jinxin Liu, Zifeng Zhuang, Donglin Wang
Reinforcement Learning Consistency Regularization Reward Learning Preference Based Reinforcement Learning Peer Learning Augmentation Free Self Supervised Learning

June 16, 2023

Fairness in Preference-based Reinforcement Learning
Umer Siddique, Abhinav Sinha, Yongcan Cao
Procedural Fairness Policy Learning Vector Valued Preference Based Reinforcement Learning Preference Based Reward

June 6, 2023

PEARL: Zero-shot Cross-task Preference Alignment and Robust Reward Learning for Robotic Manipulation
Runze Liu, Yali Du, Fengshuo Bai, Jiafei Lyu, Xiu Li
Robotic Manipulation Preference Alignment Preference Based Reinforcement Learning Robust Reward

May 29, 2023

Provable Reward-Agnostic Preference-Based Reinforcement Learning
Wenhao Zhan, Masatoshi Uehara, Wen Sun, Jason D. Lee
Reinforcement Learning Preference Feedback Preference Based Reinforcement Learning Preference Model

May 27, 2023

Query-Policy Misalignment in Preference-Based Reinforcement Learning
Xiao Hu, Jianxiong Li, Xianyuan Zhan, Qing-Shan Jia, Ya-Qin Zhang
Reinforcement Learning Policy Learning Preference Based Reinforcement Learning Policy Alignment

May 24, 2023

Inverse Preference Learning: Preference-based RL without a Reward Function
Joey Hejna, Dorsa Sadigh
Reinforcement Learning Reward Function Reward Model Preference Learning Preference Based Reinforcement Learning

May 23, 2023

PEARL: Prompting Large Language Models to Plan and Execute Actions Over Long Documents
Simeng Sun, Yang Liu, Shuohang Wang, Chenguang Zhu, Mohit Iyyer
Large Language Model Complex Reasoning Complex Reasoning Task Past Action Long Document Long Text Shot Prompting Preference Based Reinforcement Learning

February 17, 2023

January 27, 2023

Reinforcement Learning from Diverse Human Preferences
Wanqi Xue, Bo An, Shuicheng Yan, Zhongwen Xu
Reinforcement Learning Deep Reinforcement Learning Human Preference Preference Based Reinforcement Learning Belief Dependent Reward

November 14, 2022

Towards Abstractive Timeline Summarisation using Preference-based Reinforcement Learning
Yuxuan Ye, Edwin Simpson
Preference Based Reinforcement Learning Abstractive Summarisation Timeline Summarization

November 12, 2022

Rewards Encoding Environment Dynamics Improves Preference-based Reinforcement Learning
Katherine Metcalf, Miguel Sarabia, Barry-John Theobald
Reinforcement Learning Reward Function Preference Based Reinforcement Learning Preference Based Reward

June 20, 2022

Sampling Efficient Deep Reinforcement Learning through Preference-Guided Stochastic Exploration
Wenhui Huang, Cong Zhang, Jingda Wu, Xiangkun He, Jie Zhang, Chen Lv
Deep Reinforcement Learning Deep Q Learning Sample Efficient Reinforcement Learning Preference Based Reinforcement Learning Greedy Exploration

May 24, 2022

Reward Uncertainty for Exploration in Preference-based Reinforcement Learning
Xinran Liang, Katherine Shu, Kimin Lee, Pieter Abbeel
Reinforcement Learning Environment Exploration Reward Model Preference Based Reinforcement Learning Reward Ambiguity

May 23, 2022

Human-in-the-loop: Provably Efficient Preference-based Reinforcement Learning with General Function Approximation
Xiaoyu Chen, Han Zhong, Zhuoran Yang, Zhaoran Wang, Liwei Wang
Optimal Policy Human in the Loop Preference Based Reinforcement Learning Human in the Loop Reinforcement Trajectory Preference

March 18, 2022

SURF: Semi-supervised Reward Learning with Data Augmentation for Feedback-efficient Preference-based Reinforcement Learning
Jongjin Park, Younggyo Seo, Jinwoo Shin, Honglak Lee, Pieter Abbeel, Kimin Lee
Reinforcement Learning Data Augmentation Reward Function Reward Learning Preference Based Reinforcement Learning Semi Supervised Reward

December 20, 2021

Interpretable Preference-based Reinforcement Learning with Tree-Structured Reward Functions
Tom Bewley, Freddy Lecue
Reinforcement Learning Reward Function Preference Based Reinforcement Learning Reward Tree

Preference Based Reinforcement Learning

Papers

Incorporating Human Flexibility through Reward Preferences in Human-AI Teaming

Pearl: Personalizing Large Language Model Writing Assistants with Generation-Calibrated Retrievers

STRAPPER: Preference-based Reinforcement Learning via Self-training Augmentation and Peer Regularization

Fairness in Preference-based Reinforcement Learning

PEARL: Zero-shot Cross-task Preference Alignment and Robust Reward Learning for Robotic Manipulation

Provable Reward-Agnostic Preference-Based Reinforcement Learning

Query-Policy Misalignment in Preference-Based Reinforcement Learning

Inverse Preference Learning: Preference-based RL without a Reward Function

PEARL: Prompting Large Language Models to Plan and Execute Actions Over Long Documents

Exploiting Unlabeled Data for Feedback Efficient Human Preference based Reinforcement Learning

A State Augmentation based approach to Reinforcement Learning from Human Preferences

Data Driven Reward Initialization for Preference based Reinforcement Learning

Reinforcement Learning from Diverse Human Preferences

Towards Abstractive Timeline Summarisation using Preference-based Reinforcement Learning

Rewards Encoding Environment Dynamics Improves Preference-based Reinforcement Learning

Sampling Efficient Deep Reinforcement Learning through Preference-Guided Stochastic Exploration

Reward Uncertainty for Exploration in Preference-based Reinforcement Learning

Human-in-the-loop: Provably Efficient Preference-based Reinforcement Learning with General Function Approximation

SURF: Semi-supervised Reward Learning with Data Augmentation for Feedback-efficient Preference-based Reinforcement Learning

Interpretable Preference-based Reinforcement Learning with Tree-Structured Reward Functions