the latest in aiBeta

Reinforcement Learning Objective

Reinforcement learning (RL) objective design focuses on defining how agents learn optimal behaviors, balancing reward maximization with constraints like safety and robustness. Current research emphasizes developing objectives that handle multiple, potentially conflicting goals (multi-objective RL), incorporate risk awareness, and improve sample efficiency through techniques like transition occupancy matching and fine-grained reward modeling. These advancements are crucial for deploying RL in complex, real-world scenarios, particularly in safety-critical applications and for improving the efficiency and reliability of training large language models.

13papers

Papers

February 24, 2025

Yes, Q-learning Helps Offline In-Context RL
Reinforcement Learning Offline Reinforcement Learning Q Learning Reinforcement Learning Objective

May 26, 2024

Safe and Balanced: A Framework for Constrained Multi-Objective Reinforcement Learning
Participation Constraint Policy OpTimization New Framework Natural Policy Gradient Multi Objective Reinforcement Learning Multi Objective Learning Reinforcement Learning Objective

May 20, 2024

Reward-Punishment Reinforcement Learning with Maximum Entropy
Maximum Entropy Reinforcement Learning Reinforcement Learning Objective Behavior Policy Softmax Function

February 11, 2024

An Empirical Study on the Power of Future Prediction in Partially Observable Environments
Future Prediction Observable Environment Long Term Memory Reinforcement Learning Objective History Representation Evidence Piece Reinforcement Learning Representation Learning

January 11, 2024

Improving Large Language Models via Fine-grained Reinforcement Learning with Minimum Editing Constraint
Editing Model Fine Grained Reinforcement Learning Reinforcement Learning Objective Adversarial Reward

October 25, 2023

Controlled Decoding from Language Models
Language Model Reinforcement Learning Objective Compound Token Reinforcement Learning Regularized Reinforcement Learning

October 18, 2023

On The Expressivity of Objective-Specification Formalisms in Reinforcement Learning
Markovian Reward Reinforcement Learning Multi Objective Reinforcement Learning Reinforcement Learning Objective Behavior Expressivity Style

September 12, 2023

Risk-Aware Reinforcement Learning through Optimal Transport Theory
Reward Maximization Risk Aware Reinforcement Learning Optimal Transport Reinforcement Learning Objective Risk Aware Reinforcement Learning

May 22, 2023

TOM: Learning Policy-Aware Models for Model-Based Reinforcement Learning via Transition Occupancy Matching
Reinforcement Learning Objective State Occupancy Matching Model Based Reinforcement Learning LeArning Abstract Continuous Control Task

March 9, 2023

Computably Continuous Reinforcement-Learning Objectives are PAC-learnable
PAC Learnability Reinforcement Learning Objective Cumulative Reward

September 18, 2022

Simplifying Model-based RL: Learning Representations, Latent-space Models, and Policies with One Objective
Representation Learning Reinforcement Learning Objective Prior Policy Reinforcement Learning Model Free Reinforcement Learning Latent Space

July 17, 2022

Reinforcement Learning For Survival, A Clinically Motivated Method For Critically Ill Patients
Optimal Treatment Reinforcement Learning Deep RL Deep Survival Intensive Care Reinforcement Learning Objective

June 17, 2022

AnyMorph: Learning Transferable Polices By Inferring Agent Morphology
Policy Transfer Reinforcement Learning Objective Reinforcement Learning Mathematical Morphology

June 7, 2022

Imitating Past Successes can be Very Suboptimal
Conditioned Imitation Reward Maximization Financial Success Reinforcement Learning Balancing Efficiency Reinforcement Learning Objective