Contextual Bandit Algorithm

Contextual bandit algorithms optimize sequential decision-making by learning to select actions that maximize rewards based on observed contextual information. Current research emphasizes extending these algorithms to handle diverse data types (e.g., count data, relative feedback), complex model structures (e.g., generalized linear models, neural networks), and challenging real-world constraints (e.g., partial observability, domain adaptation, privacy). This active area of research is crucial for improving personalized systems in various fields, including healthcare, recommendation systems, and online advertising, by enabling more efficient and robust learning from user interactions.

Papers

March 30, 2022

Flexible and Efficient Contextual Bandits with Heterogeneous Treatment Effect Oracles
Aldo Gael Carranza, Sanath Kumar Krishnamurthy, Susan Athey
Contextual Bandit Extension Study Bandit Algorithm Contextual Bandit Algorithm Heterogeneous Treatment Effect Estimation

February 2, 2022

Communication Efficient Federated Learning for Generalized Linear Bandits
Chuanhao Li, Hongning Wang
Contextual Bandit Algorithm Communication Efficient Federated Learning Online Regression

December 28, 2021

Multitask Learning and Bandits via Robust Statistics
Kan Xu, Hamsa Bastani
Multitask Learning Bias Variance Contextual Bandit Algorithm Heterogeneous Learning Robust Statistic

December 11, 2021

Privacy Amplification via Shuffling for Linear Contextual Bandits
Evrard Garcelon, Kamalika Chaudhuri, Vianney Perchet, Matteo Pirotta
Differential Privacy Linear Contextual Bandit Shuffle Model Privacy Amplification Contextual Linear Bandit Contextual Bandit Algorithm

December 10, 2021

Efficient Action Poisoning Attacks on Linear Contextual Bandits
Guanlin Liu, Lifeng Lai
Poisoning Attack Bandit Algorithm Linear Contextual Bandit Contextual Bandit Algorithm

Contextual Bandit Algorithm

Papers

Flexible and Efficient Contextual Bandits with Heterogeneous Treatment Effect Oracles

Communication Efficient Federated Learning for Generalized Linear Bandits

Multitask Learning and Bandits via Robust Statistics

Privacy Amplification via Shuffling for Linear Contextual Bandits

Efficient Action Poisoning Attacks on Linear Contextual Bandits