Gaussian Process Bandit

Gaussian Process Bandits (GP bandits) address the problem of sequentially selecting actions to maximize cumulative reward from an unknown function, modeled as a Gaussian process. Current research focuses on extending GP bandit algorithms to handle complexities like combinatorial actions, delayed or aggregated feedback, and adversarial corruptions, often employing variations of Upper Confidence Bound (UCB) and Thompson Sampling. These advancements improve the robustness and applicability of GP bandits in diverse fields, including online optimization, resource allocation, and hyperparameter tuning, where efficient exploration and exploitation are crucial. The development of tighter regret bounds and algorithms that adapt to model misspecification are also active areas of investigation.

Papers

December 3, 2024

Vector Optimization with Gaussian Process Bandits
İlter Onat Korkmaz, Yaşar Cahit Yıldırım, Çağın Ararat, Cem Tekin
Optimization Purpose Objective Function Gaussian Process Bandit

August 21, 2024

The Vizier Gaussian Process Bandit Algorithm
Xingyou Song, Qiuyi Zhang, Chansoo Lee, Emily Fertig, Tzu-Kuo Huang, Lior Belenki, Greg Kochanski, Setareh Ariafar, Srinivas Vasudevan, Sagi Perel, Daniel Golovin
Native Robustness Bayesian Optimization Standardized Benchmark Gaussian Process Bandit

December 20, 2023

Bayesian Analysis of Combinatorial Gaussian Process Bandits
Jack Sandberg, Niklas Åkerblom, Morteza Haghir Chehreghani
Application Proficiency Theoretical Understanding Contextual Bandit Bayesian Regret Gaussian Process Bandit Bayesian Setting

December 26, 2022

Gaussian Process Classification Bandits
Tatsuya Hayashi, Naoki Ito, Koji Tabata, Atsuyoshi Nakamura, Katsumasa Fujita, Yoshinori Harada, Tamiki Komatsuzaki
Active Learning Multi Armed Bandit Arm Selection Gaussian Process Bandit

June 19, 2022

Bayesian Optimization under Stochastic Delayed Feedback
Arun Verma, Zhongxiang Dai, Bryan Kian Hsiang Low
Bayesian Optimization Zeroth Order Delayed Feedback Gaussian Process Bandit

March 15, 2022

Regret Bounds for Expected Improvement Algorithms in Gaussian Process Bandit Optimization
Hung Tran-The, Sunil Gupta, Santu Rana, Svetha Venkatesh
Gaussian Process Regret Bound Cumulative Regret Information Gain Gaussian Process Bandit Expected Improvement

February 3, 2022

A Robust Phased Elimination Algorithm for Corruption-Tolerant Gaussian Process Bandits
Ilija Bogunovic, Zihan Li, Andreas Krause, Jonathan Scarlett
Native Robustness Sequential Optimization Adversarial Corruption Gaussian Process Bandit

December 24, 2021

Gaussian Process Bandits with Aggregated Feedback
Mengyan Zhang, Russell Tsuchida, Cheng Soon Ong
Gaussian Process Bandit Continuum Armed Bandit Aggregated Feedback

November 29, 2021

Contextual Combinatorial Multi-output GP Bandits with Group Constraints
Sepehr Elahi, Baran Atalar, Sevda Öğüt, Cem Tekin
Multi Armed Bandit Group Fairness Constraint Soft Set Contextual Combinatorial Gaussian Process Bandit

November 9, 2021

Misspecified Gaussian Process Bandit Optimization
Ilija Bogunovic, Andreas Krause
Bandit Feedback Cumulative Regret UCB Algorithm Gaussian Process Bandit