Optimal Dynamic Regret

Optimal dynamic regret focuses on minimizing the cumulative difference between an online learning algorithm's performance and that of an optimal algorithm with perfect hindsight, particularly in non-stationary environments where underlying parameters change over time. Current research emphasizes developing adaptive algorithms, often employing techniques like sleeping experts, ensemble methods, and variations of mirror descent, to achieve optimal regret rates in various settings including bandit problems, reinforcement learning, and linear quadratic regulators. These advancements are significant because they provide theoretically sound and practically efficient methods for handling the challenges posed by non-stationary data in diverse machine learning applications, leading to improved performance in dynamic real-world scenarios.

Papers

December 14, 2024

Doubly-Bounded Queue for Constrained Online Learning: Keeping Pace with Dynamics of Both Loss and Constraint
Juncheng Wang, Bingjie Yan, Yituo Liu
Time Varying Online Convex Optimization Interest Loss Constrained Learning Multiple Constraint Optimal Dynamic Regret

November 5, 2024

Near-Optimal Dynamic Regret for Adversarial Linear Mixture MDPs
Long-Fei Li, Peng Zhao, Zhi-Hua Zhou
Global Optimization Adversarial Markov Decision Process Optimal Dynamic Regret Linear Mixture Markov Decision Process

October 31, 2024

Online Convex Optimization with Memory and Limited Predictions
Lintao Ye, Zhengmiao Wang, Zhi-Wei Liu, Ming Chi, Xiaoling Wang, Housheng Su
Memory Trace Convex Optimization Online Convex Optimization Optimal Dynamic Regret Imperfect Prediction

July 11, 2024

Adaptive Smooth Non-Stationary Bandits
Joe Suk
Non Stationary Gap Dependent Optimal Dynamic Regret

May 30, 2024

MetaCURL: Non-stationary Concave Utility Reinforcement Learning
Bianca Marin Moreno, Margaux Brégère, Pierre Gaillard, Nadia Oudjane
Markov Decision Process Episodic Markov Decision Process State Action Pair Non Stationary Reinforcement Learning Optimal Dynamic Regret

November 14, 2023

Ensemble sampling for linear bandits: small ensembles suffice
David Janz, Alexander E. Litvak, Csaba Szepesvári
Ensemble Learning Diverse Ensemble Linear Bandit Optimal Dynamic Regret

October 7, 2023

Oracle Efficient Algorithms for Groupwise Regret
Krishna Acharya, Eshwar Ram Arunachaleswaran, Sampath Kannan, Aaron Roth, Juba Ziani
Regret Bound Online Prediction Online Linear Regression Optimal Dynamic Regret Regret Matching Oracle Efficient Algorithm

May 31, 2023

Online Label Shift: Optimal Dynamic Regret meets Practical Algorithms
Dheeraj Baby, Saurabh Garg, Tzu-Ching Yen, Sivaraman Balakrishnan, Zachary Chase Lipton, Yu-Xiang Wang
Practical Algorithm Label Distribution Online Regression Optimal Dynamic Regret

November 19, 2022

Non-stationary Risk-sensitive Reinforcement Learning: Near-optimal Dynamic Regret, Adaptive Detection, and Separation Design
Yuhao Ding, Ming Jin, Javad Lavaei
Markov Decision Process Separation Performance Risk Sensitive Reinforcement Learning Non Stationary Reinforcement Learning Optimal Dynamic Regret Entropic Risk Adaptive Detection

October 11, 2022

On Adaptivity in Non-stationary Stochastic Optimization With Bandit Feedback
Yining Wang
Adaptive Importance Bandit Feedback Non Stationary Dynamic Regret Bandit Convex Optimal Dynamic Regret

July 5, 2022

Adapting to Online Label Shift with Provable Guarantees
Yong Bai, Yu-Jie Zhang, Peng Zhao, Masashi Sugiyama, Zhi-Hua Zhou
Provable Guarantee Label Distribution Shift Optimal Dynamic Regret Online Ensemble

June 18, 2022

Optimal Dynamic Regret in LQR Control
Dheeraj Baby, Yu-Xiang Wang
Linear Quadratic Regulator Optimal Dynamic Regret Quadratic Loss Nonstochastic Control

February 26, 2022

Parameter-free Mirror Descent
Andrew Jacobsen, Ashok Cutkosky
Mirror Descent Online Linear Online Mirror Descent Parameter Free Optimal Dynamic Regret

January 21, 2022

Optimal Dynamic Regret in Proper Online Learning with Strongly Convex Losses and Beyond
Dheeraj Baby, Yu-Xiang Wang
Convex Loss Adaptive Algorithm Optimal Dynamic Regret Dynamic Regret Minimization Improper Learning

November 6, 2021

Dynamic Regret Minimization for Control of Non-stationary Linear Dynamical Systems
Yuwei Luo, Varun Gupta, Mladen Kolar
External Control Optimal Regret Non Stationary Linear Quadratic Regulator Optimal Dynamic Regret Dynamic Regret Minimization Linear Feedback