Regret Bound

Regret bound analysis focuses on quantifying the performance of online learning algorithms, particularly in scenarios like multi-armed bandits and reinforcement learning, by measuring the difference between an algorithm's cumulative reward and that of an optimal strategy. Current research emphasizes developing algorithms with tighter regret bounds, often employing techniques like optimism in the face of uncertainty, Thompson sampling, and advanced exploration strategies tailored to specific problem structures (e.g., linear models, contextual bandits). These improvements have significant implications for various applications, including personalized recommendations, online advertising, and resource allocation, by enabling more efficient and effective decision-making under uncertainty.

Papers

March 13, 2023

Best-of-three-worlds Analysis for Linear Bandits with Follow-the-regularized-leader Algorithm
Fang Kong, Canzhe Zhao, Shuai Li
General Analysis Multi Armed Bandit Regret Bound Linear Bandit Follow the Regularized Leader

March 10, 2023

A General Recipe for the Analysis of Randomized Multi-Armed Bandit Algorithms
Dorian Baudry, Kazuya Suzuki, Junya Honda
General Analysis Multi Armed Bandit Regret Bound Bandit Algorithm Regret Analysis Complete Recipe Logarithmic Regret

March 9, 2023

Improved Regret Bounds for Online Kernel Selection under Bandit Feedback
Junfan Li, Shizhong Liao
Regret Bound Bandit Feedback Lipschitz Loss Online Regression Online Kernel

March 6, 2023

Accelerated Rates between Stochastic and Adversarial Online Convex Optimization
Sarah Sachs, Hedi Hadiji, Tim van Erven, Cristobal Guzman
Regret Bound Stochastic Way Online Convex Optimization Adversarial Loss Minimax Regret Anderson Acceleration

February 27, 2023

Improved Best-of-Both-Worlds Guarantees for Multi-Armed Bandits: FTRL with General Regularizers and Multiple Optimal Arms
Tiancheng Jin, Junyan Liu, Haipeng Luo
Multi Armed Bandit Regret Bound Follow the Regularized Leader Optimal Arm Optimal Guarantee

February 14, 2023

Improved Regret Bounds for Linear Adversarial MDPs via Linear Optimization
Fang Kong, Xiangcheng Zhang, Baoxiang Wang, Shuai Li
Markov Decision Process Regret Bound Linear Programming Adversarial Environment Adversarial Markov Decision Process Linear Markov Decision Process

February 9, 2023

Optimistic Online Mirror Descent for Bridging Stochastic and Adversarial Online Convex Optimization
Sijia Chen, Yu-Jie Zhang, Wei-Wei Tu, Peng Zhao, Lijun Zhang
Regret Bound Dynamic Regret Online Mirror Descent Dynamic Regret Minimization Generative Bridging Domain

February 8, 2023

Near-Optimal Adversarial Reinforcement Learning with Switching Costs
Ming Shi, Yingbin Liang, Ness Shroff
Reinforcement Learning Regret Bound Hidden CoST Regret Analysis Adversarial Reinforcement Learning

February 7, 2023

February 3, 2023

Randomized Gaussian Process Upper Confidence Bound with Tighter Bayesian Regret Bounds
Shion Takeno, Yu Inatsu, Masayuki Karasuyama
Gaussian Process Regret Bound Black Box Optimization UCB Algorithm

January 30, 2023

Regret Bounds for Markov Decision Processes with Recursive Optimized Certainty Equivalents
Wenhao Xu, Xuefeng Gao, Xuedong He
Markov Decision Process Regret Bound Recursive Algorithm Risk Sensitive Reinforcement Learning Tabular Markov Decision Process Optimal Dependence Entropic Risk Certainty Equivalent

January 27, 2023

Decentralized Online Bandit Optimization on Directed Graphs with Regret Bounds
Johan Östman, Ather Gattami, Daniel Gillblad
Multi Armed Bandit Regret Bound Directed Graph Cooperative Bandit Pseudo Regret

January 26, 2023

Causal Bandits without Graph Learning
Mikhail Konobeev, Jalal Etesami, Negar Kiyavash
Causal Graph Graph Learning Regret Bound Efficient Algorithm Reward Structure Causal Bandit

January 11, 2023

Adversarial Online Multi-Task Reinforcement Learning
Quan Nguyen, Nishant A. Mehta
Multi Task Regret Bound Finite Horizon

December 12, 2022

Corruption-Robust Algorithms with Uncertainty Weighting for Nonlinear Contextual Bandits and Markov Decision Processes
Chenlu Ye, Wei Xiong, Quanquan Gu, Tong Zhang
Reinforcement Learning Markov Decision Process Contextual Bandit Regret Bound O$ Regret Corruption Robust Algorithm

December 7, 2022

Stochastic Rising Bandits
Alberto Maria Metelli, Francesco Trovò, Matteo Pirola, Marcello Restelli
Regret Bound Stochastic Way Non Stationary Stochastic Multi Armed Bandit Sequential Selection Online Model Selection

November 25, 2022

Model-Free Reinforcement Learning with the Decision-Estimation Coefficient
Dylan J. Foster, Noah Golowich, Jian Qian, Alexander Rakhlin, Ayush Sekhari
Estimation Task Regret Bound Optimal Regret Model Free Reinforcement Learning Structured Bandit

November 10, 2022

Regret Bounds for Noise-Free Cascaded Kernelized Bandits
Zihan Li, Jonathan Scarlett
Regret Bound Cumulative Regret UCB Algorithm Vector Valued Kernel Bandit Function Network

November 5, 2022

Leveraging the Hints: Adaptive Bidding in Repeated First-Price Auctions
Wei Zhang, Yanjun Han, Zhengyuan Zhou, Aaron Flores, Tsachy Weissman
Regret Bound Natural Language Hint Paper Bidding Minimax Optimal Regret Price Auction Bidding Strategy