Sequential Decision Making Problem

Sequential decision-making problems involve choosing a series of actions to optimize a long-term outcome, encompassing diverse applications from robotics and healthcare to finance and game playing. Current research focuses on improving the efficiency and robustness of algorithms like reinforcement learning (including Q-learning and its variants), Thompson sampling, and Monte Carlo Tree Search, often incorporating model architectures such as transformers and graph neural networks to handle complex state spaces and non-stationary environments. These advancements aim to address challenges like risk sensitivity, fairness, generalization to unseen data (out-of-distribution detection), and interpretability of learned policies, ultimately leading to more reliable and effective autonomous systems in various domains.

Papers

July 21, 2022

Delayed Feedback in Generalised Linear Bandits Revisited
Benjamin Howson, Ciara Pike-Burke, Sarah Filippi
Linear Bandit Sequential Decision Making Problem Regret Guarantee Delayed Feedback Optimistic Algorithm

July 2, 2022

Reinforcement Learning Approaches for the Orienteering Problem with Stochastic and Dynamic Release Dates
Yuanyuan Li, Claudia Archetti, Ivana Ljubic
Reinforcement Learning Optimal Policy Value Function Stochastic Way Sequential Decision Making Problem Reinforcement Learning Approach Orienteering Problem Two Stage Stochastic

June 3, 2022

A Deep Reinforcement Learning Framework For Column Generation
Cheng Chi, Amine Mohamed Aboussalah, Elias B. Khalil, Juyoung Wang, Zoha Sherkat-Masoumi
Reinforcement Learning Sequential Decision Making Problem Linear Programming Column Generation

May 30, 2022

Adaptive Sampling for Discovery
Ziping Xu, Eunjae Shim, Ambuj Tewari, Paul Zimmerman
Scientific Discovery Drug Discovery Sequential Decision Making Problem Adaptive Sampling Efficient Discovery Information Directed Sampling

April 28, 2022

Towards Flexible Inference in Sequential Decision Problems via Bidirectional Transformers
Micah Carroll, Jessy Lin, Orr Paradise, Raluca Georgescu, Mingfei Sun, David Bignell, Stephanie Milani, Katja Hofmann, Matthew Hausknecht, Anca Dragan, Sam Devlin
Language Model Behavior Cloning Sequential Decision Making Problem Sequential Decision Making Bidirectional Transformer Flexible Inference Mask Sequence

March 28, 2022

An Online Approach to Solve the Dynamic Vehicle Routing Problem with Stochastic Trip Requests for Paratransit Services
Michael Wilbur, Salah Uddin Kadir, Youngseo Kim, Geoffrey Pettet, Ayan Mukhopadhyay, Philip Pugliese, Samitha Samaranayake, Aron Laszka, Abhishek Dubey
Markov Decision Process Sequential Decision Making Problem Travel Time Paratransit Service

March 20, 2022

Model-based Multi-agent Reinforcement Learning: Recent Progress and Prospects
Xihuai Wang, Zhicheng Zhang, Weinan Zhang
Multi Agent Reinforcement Learning Recent Advance Model Based Sequential Decision Making Problem Visionary ProSpect Multi Agent Scenario Model Based Multi Agent Reinforcement

February 25, 2022

Non-stationary Bandits and Meta-Learning with a Small Set of Optimal Arms
MohammadJavad Azizi, Thang Duong, Yasin Abbasi-Yadkori, András György, Claire Vernade, Mohammad Ghavamzadeh
Meta Learning Non Stationary Sequential Decision Making Problem Tiny Set Optimal Arm

February 15, 2022

Zero-Shot Assistance in Sequential Decision Problems
Sebastiaan De Peuter, Samuel Kaski
Agent Smith Decomposed Automation Correction Sequential Decision Making Problem Automated Approach

January 29, 2022

Bellman Meets Hawkes: Model-Based Reinforcement Learning via Temporal Point Processes
Chao Qu, Xiaoyu Tan, Siqiao Xue, Xiaoming Shi, James Zhang, Hongyuan Mei
Reinforcement Learning Model Based Reinforcement Learning Sequential Decision Making Problem Temporal Point Process Hawkes Process Bellman Operator Asynchronous Stochastic

January 12, 2022

Multi-echelon Supply Chains with Uncertain Seasonal Demands and Lead Times Using Deep Reinforcement Learning
Julio César Alves, Geraldo Robson Mateus
Deep Reinforcement Learning Markov Decision Process Sequential Decision Making Problem Nonlinear Programming Lead Time Echelon Supply Chain Demand Uncertainty

December 1, 2021

Efficient Symptom Inquiring and Diagnosis via Adaptive Alignment of Reinforcement Learning and Classification
Hongyi Yuan, Sheng Yu
Reinforcement Learning Classification Code Medical Diagnosis Sequential Decision Making Problem Automatic Diagnosis Symptom Related Medical Data Alignment Tuning

Sequential Decision Making Problem

Papers

Delayed Feedback in Generalised Linear Bandits Revisited

Reinforcement Learning Approaches for the Orienteering Problem with Stochastic and Dynamic Release Dates

A Deep Reinforcement Learning Framework For Column Generation

Adaptive Sampling for Discovery

Towards Flexible Inference in Sequential Decision Problems via Bidirectional Transformers

An Online Approach to Solve the Dynamic Vehicle Routing Problem with Stochastic Trip Requests for Paratransit Services

Model-based Multi-agent Reinforcement Learning: Recent Progress and Prospects

Non-stationary Bandits and Meta-Learning with a Small Set of Optimal Arms

Zero-Shot Assistance in Sequential Decision Problems

Bellman Meets Hawkes: Model-Based Reinforcement Learning via Temporal Point Processes

Multi-echelon Supply Chains with Uncertain Seasonal Demands and Lead Times Using Deep Reinforcement Learning

Efficient Symptom Inquiring and Diagnosis via Adaptive Alignment of Reinforcement Learning and Classification