Exploration Exploitation Tradeoff

The exploration-exploitation tradeoff describes the challenge of balancing the need to explore unknown possibilities against the desire to exploit known, potentially suboptimal, solutions. Current research focuses on optimizing this tradeoff across diverse fields using various approaches, including Bayesian optimization, reinforcement learning, and contextual bandit algorithms, often within the context of multi-agent systems or complex environments like code refinement or engine control. This fundamental problem has significant implications for improving the efficiency and effectiveness of algorithms in numerous domains, from robotics and machine learning to resource management and scientific discovery.

Papers

October 2, 2024

Diverse Expected Improvement (DEI): Diverse Bayesian Optimization of Expensive Computer Simulators
John Joshua Miller, Simon Mak, Benny Sun, Sai Ranjeet Narayanan, Suo Yang, Zongxuan Sun, Kenneth S. Kim, Chol-Bum Mike Kweon
Bayesian Optimization Surrogate Model Numerical Simulation Exploration Exploitation Trade Exploration Exploitation Tradeoff Expected Improvement

May 31, 2024

Principal-Agent Multitasking: the Uniformity of Optimal Contracts and its Efficient Learning via Instrumental Regression
Shiliang Zuo
Efficient Learning Instrumental Variable Uniformity Metric Loss Minimization Principal Agent Optimal Contract Exploration Exploitation Tradeoff

May 26, 2024

Code Repair with LLMs gives an Exploration-Exploitation Tradeoff
Hao Tang, Keya Hu, Jin Peng Zhou, Sicheng Zhong, Wei-Long Zheng, Xujie Si, Kevin Ellis
Large Language Model Program Synthesis Program Repair Exploration Exploitation Breadth First Exploration Exploitation Tradeoff Invariant Synthesis

April 12, 2024

Auto-configuring Exploration-Exploitation Tradeoff in Evolutionary Computation via Deep Reinforcement Learning
Zeyuan Ma, Jiacheng Chen, Hongshu Guo, Yining Ma, Yue-Jiao Gong
Deep Reinforcement Learning Evolutionary Computation Deep Reinforcement Exploration Exploitation Trade Exploration Exploitation Tradeoff

December 29, 2023

Exploring the Sensitivity of LLMs' Decision-Making Capabilities: Insights from Prompt Variation and Hyperparameters
Manikanta Loya, Divya Anand Sinha, Richard Futrell
Large Language Model Decision Making DCU Insight AQ Related Hyperparameters Language Modeling Exploration Exploitation Tradeoff

August 29, 2023

Distributed multi-agent target search and tracking with Gaussian process and reinforcement learning
Jigang Kim, Dohyun Jang, H. Jin Kim
Reinforcement Learning Multi Agent Reinforcement Learning Gaussian Process Multi Agent Multiple Robot Aerial Vehicle Exploration Exploitation Tradeoff

April 16, 2023

Dynamic Exploration-Exploitation Trade-Off in Active Learning Regression with Bayesian Hierarchical Modeling
Upala Junaida Islam, Kamran Paynabar, George Runger, Ashif Sikandar Iquebal
Active Learning Hierarchical Bayesian Exploration Exploitation Trade Approximate Bayesian Computation Exploration Exploitation Tradeoff Active Regression

March 17, 2023

An Empirical Evaluation of Federated Contextual Bandit Algorithms
Alekh Agarwal, H. Brendan McMahan, Zheng Xu
Contextual Bandit Softmax Function Empirical Evaluation Contextual Bandit Algorithm Exploration Exploitation Tradeoff Implicit Communication Federated Linear Contextual Bandit

December 12, 2022

Decentralized Stochastic Multi-Player Multi-Armed Walking Bandits
Guojun Xiong, Jian Li
Multi Armed Bandit Decentralized Algorithm Exploration Exploitation Tradeoff Multi Player Multi Armed Bandit

August 22, 2022

Formal Contracts Mitigate Social Dilemmas in Multi-Agent RL
Andreas A. Haupt, Phillip J. K. Christoffersen, Mehul Damani, Dylan Hadfield-Menell
Data Augmentation Multi Agent Reinforcement Learning Multi Objective Reinforcement Learning Selfish Agent Contract Theory Multi Agent RL Exploration Exploitation Tradeoff

January 18, 2022

Speed-vs-Accuracy Tradeoff in Collective Estimation: An Adaptive Exploration-Exploitation Case
Mohsen Raoufi, Heiko Hamann, Pawel Romanczuk
Collective Decision Making Accuracy Tradeoff Collective Decision Exploration Exploitation Tradeoff Collective Estimation

Exploration Exploitation Tradeoff

Papers

Diverse Expected Improvement (DEI): Diverse Bayesian Optimization of Expensive Computer Simulators

Principal-Agent Multitasking: the Uniformity of Optimal Contracts and its Efficient Learning via Instrumental Regression

Code Repair with LLMs gives an Exploration-Exploitation Tradeoff

Auto-configuring Exploration-Exploitation Tradeoff in Evolutionary Computation via Deep Reinforcement Learning

Exploring the Sensitivity of LLMs' Decision-Making Capabilities: Insights from Prompt Variation and Hyperparameters

Distributed multi-agent target search and tracking with Gaussian process and reinforcement learning

Dynamic Exploration-Exploitation Trade-Off in Active Learning Regression with Bayesian Hierarchical Modeling

An Empirical Evaluation of Federated Contextual Bandit Algorithms

Decentralized Stochastic Multi-Player Multi-Armed Walking Bandits

Formal Contracts Mitigate Social Dilemmas in Multi-Agent RL

Speed-vs-Accuracy Tradeoff in Collective Estimation: An Adaptive Exploration-Exploitation Case