Exploration Exploitation

The exploration-exploitation dilemma describes the fundamental challenge in decision-making systems of balancing the need to explore unknown options against the desire to exploit known, rewarding ones. Current research focuses on improving the efficiency of this trade-off across various domains, employing techniques like contextual bandits, Thompson sampling, and Bayesian optimization, often integrated with neural networks and graph neural networks to handle complex data and large action spaces. These advancements are significantly impacting fields like reinforcement learning, recommendation systems, and automated planning, leading to more efficient algorithms and improved performance in diverse applications.

Papers

August 16, 2022

A Policy Resonance Approach to Solve the Problem of Responsibility Diffusion in Multiagent Reinforcement Learning
Qingxu Fu, Tenghai Qiu, Jianqiang Yi, Zhiqiang Pu, Xiaolin Ai, Wanmai Yuan
Right Problem Single Agent Exploration Exploitation Responsibility Allocation

July 27, 2022

Adapting the Exploration-Exploitation Balance in Heterogeneous Swarms: Tracking Evasive Targets
Hian Lee Kwa, Victor Babineau, Julien Philippot, Roland Bouffanais
Multi Robot Multi Robot System Exploration Exploitation Heterogeneous Swarm

June 8, 2022

Neural Bandit with Arm Group Graph
Yunzhe Qi, Yikun Ban, Jingrui He
Contextual Bandit Optimal Regret Bandit Algorithm Best Arm Exploration Exploitation Neural Bandit

January 4, 2022

Multi-Stage Episodic Control for Strategic Exploration in Text Games
Jens Tuyls, Shunyu Yao, Sham Kakade, Karthik Narasimhan
Reinforcement Learning Sparse Reward Text Based Game Exploration Exploitation Episodic Control

Exploration Exploitation

Papers

A Policy Resonance Approach to Solve the Problem of Responsibility Diffusion in Multiagent Reinforcement Learning

Adapting the Exploration-Exploitation Balance in Heterogeneous Swarms: Tracking Evasive Targets

Neural Bandit with Arm Group Graph

Multi-Stage Episodic Control for Strategic Exploration in Text Games