Continuum Armed Bandit

Continuum-armed bandits address the challenge of sequentially selecting the best action from a continuous space to maximize cumulative reward, a problem arising in diverse fields like automated trading and network optimization. Current research focuses on developing algorithms, often employing Gaussian processes or Bayesian optimization, that efficiently balance exploration and exploitation within this continuous action space, particularly under constraints or non-stationary conditions. These advancements are improving the performance of online decision-making systems in applications where the action space is not discrete, leading to more efficient and adaptive solutions in various domains.

Papers

December 3, 2024

Selective Reviews of Bandit Problems in AI via a Statistical View
Pengjie Zhou, Haoyu Wei, Huiming Zhang
Reinforcement Learning Artificial Intelligence Multi Armed Bandit Contextual Bandit Bandit Problem Statistical Task Continuum Armed Bandit

November 19, 2024

ACING: Actor-Critic for Instruction Learning in Black-Box Large Language Models
Salma Kharrat, Fares Fourati, Marco Canini
Full Model Large Language Actor Critic High Performance Task Instruction Instruction Learning Continuum Armed Bandit

June 9, 2024

Contextual Continuum Bandits: Static Versus Dynamic Regret
Arya Akhavan, Karim Lounici, Massimiliano Pontil, Alexandre B. Tsybakov
Optimal Regret Sub Linear Regret Dynamic Regret Continuum Armed Bandit

October 2, 2023

A Learning Based Scheme for Fair Timeliness in Sparse Gossip Networks
Purbesh Mitra, Sennur Ulukus
Network Structure Gossip Algorithm Poisson Process Constrained Channel Learning Scheme Continuum Armed Bandit

April 26, 2023

Adaptation to Misspecified Kernel Regularity in Kernelised Bandits
Yusha Liu, Aarti Singh
Adaptation Concern Bandit Algorithm Kernel Hilbert Space Kernel Bandit Continuum Armed Bandit

February 18, 2023

Online Continuous Hyperparameter Optimization for Generalized Linear Contextual Bandits
Yue Kang, Cho-Jui Hsieh, Thomas C. M. Lee
Hyperparameter Optimization Contextual Bandit Linear Contextual Bandit Contextual Bandit Algorithm Continuum Armed Bandit

November 27, 2022

Rectified Pessimistic-Optimistic Learning for Stochastic Continuum-armed Bandit with Constraints
Hengquan Guo, Qi Zhu, Xin Liu
Participation Constraint Sublinear Regret Policy Optimization Optimistic Learning Continuum Armed Bandit Constraint Function

August 4, 2022

Nonstationary Continuum-Armed Bandit Strategies for Automated Trading in a Simulated Financial Market
Bingde Liu, John Cartlidge
Bayesian Optimization Trading Strategy Market Simulator Automated Cryptocurrency Trading Continuum Armed Bandit

December 24, 2021

Gaussian Process Bandits with Aggregated Feedback
Mengyan Zhang, Russell Tsuchida, Cheng Soon Ong
Gaussian Process Bandit Continuum Armed Bandit Aggregated Feedback