the latest in aiBeta

Constraint Reward

Constraint reward methods in reinforcement learning aim to optimize agent behavior while strictly adhering to safety constraints, balancing performance goals with risk mitigation. Current research focuses on developing algorithms that effectively integrate constraint rewards, including dual-expert approaches combining performance and safety objectives, and methods using safety editor policies to modify potentially unsafe actions. These techniques are proving valuable in diverse applications, such as robotics and adversarial attacks on text classifiers, by significantly improving safety and reliability while maintaining high performance. The resulting advancements are driving progress in safe and robust autonomous systems.

3papers

Papers

January 17, 2025

Pairwise Elimination with Instance-Dependent Guarantees for Bandits with Cost Subsidy
Ishank Juneja, Carlee Joe-Wong, Osman Yağan
Reward Report Elimination Based Algorithm Constraint Reward Cost Effective Multi Armed Bandit Instance Dependent

December 26, 2024

Multi-Attribute Constraint Satisfaction via Language Model Rewriting
Ashutosh Baheti, Debanjana Chakraborty, Faeze Brahman, Ronan Le Bras, Ximing Lu, Nouha Dziri, Yejin Choi, Mark Riedl, Maarten Sap
Constraint Satisfaction Problem Language Model Attribute Control Constraint Reward

July 2, 2024

Safe CoR: A Dual-Expert Approach to Integrating Imitation Learning and Safe Reinforcement Learning Using Constraint Rewards
Hyeokjin Kwon, Gunmin Lee, Junseo Lee, Songhwai Oh
Constraint Reward Imitation Learning Safe Reinforcement Learning Dual Approach Safety Constraint

May 20, 2024

A Constraint-Enforcing Reward for Adversarial Attacks on Text Classifiers
Tom Roth, Inigo Jauregi Unanue, Alsharif Abuadbba, Massimo Piccardi
Constraint Reward Adversarial Attack Adversarial Example Paraphrase Detection Text Classifier

January 28, 2022

Towards Safe Reinforcement Learning with a Safety Editor Policy
Haonan Yu, Wei Xu, Haichao Zhang
Safety Filter Constraint Reward Safe Reinforcement Learning