Bandit Task

Bandit tasks, a class of sequential decision-making problems, aim to maximize cumulative reward by strategically selecting actions from a set of options with uncertain payoffs. Current research focuses on improving efficiency through techniques like transferring knowledge between similar tasks (e.g., using transfer learning and meta-learning), incorporating uncertainty estimation (e.g., via Thompson Sampling and diffusion models), and leveraging shared representations across multiple tasks. These advancements are significant because they enhance the sample efficiency and robustness of bandit algorithms, with applications ranging from personalized recommendations to efficient resource allocation in complex systems.

Papers

September 30, 2024

Exploiting Adjacent Similarity in Multi-Armed Bandit Tasks via Transfer of Reward Samples
NR Rahul, Vaibhav Katewa
Multi Armed Bandit Formality Transfer High Similarity Bandit Task

April 3, 2024

On the Importance of Uncertainty in Decision-Making with Large Language Models
Nicolò Felicioni, Lucas Maystre, Sina Ghiassian, Kamil Ciosek
Natural Language High Uncertainty Anticipation Uncertainty Estimation Decision Making Contextual Bandit Importance Aware Bandit Task

March 31, 2024

Meta Learning in Bandits within Shared Affine Subspaces
Steven Bilaj, Sofien Dhouib, Setareh Maghsudi
Contextual Bandit Bandit Task

January 12, 2023

Thompson Sampling with Diffusion Generative Prior
Yu-Guan Hsieh, Shiva Prasad Kasiviswanathan, Branislav Kveton, Patrick Blöbaum
Diffusion Model Thompson Sampling Posterior Sampling Bandit Model Generative Diffusion Prior Bandit Task

October 27, 2022

Lifelong Bandit Optimization: No Prior and No Regret
Felix Schur, Parnian Kassraie, Jonas Rothfuss, Andreas Krause
Linear Bandit Sublinear Regret Bandit Algorithm Simple Regret Bandit Task

March 29, 2022

Nearly Minimax Algorithms for Linear Bandits with Shared Representation
Jiaqi Yang, Qi Lei, Jason D. Lee, Simon S. Du
Regret Bound Linear Bandit Joint Representation Minimax Regret Bandit Task Minimax Optimal Algorithm

February 25, 2022

Meta-Learning for Simple Regret Minimization
Mohammadjavad Azizi, Branislav Kveton, Mohammad Ghavamzadeh, Sumeet Katariya
Regret Minimization Bandit Problem Bandit Task Achievable Regret

November 12, 2021

Hierarchical Bayesian Bandits
Joey Hong, Branislav Kveton, Manzil Zaheer, Mohammad Ghavamzadeh
Thompson Sampling Task Similarity Bandit Task Hierarchical Bayesian Bandit