Approximate Policy Iteration

Approximate Policy Iteration (API) aims to efficiently solve reinforcement learning problems by iteratively improving policies through approximate policy evaluation and improvement steps. Current research focuses on addressing the "curse of dimensionality" using deep neural networks, particularly Galerkin methods and physics-informed neural networks, and on developing formally verified algorithms for improved reliability. These advancements enhance the applicability of API to high-dimensional control problems and safety-critical systems, improving both theoretical understanding and practical performance in various domains like robotics and adaptive filtering.

Papers

June 13, 2024

Optimal Control of Agent-Based Dynamics under Deep Galerkin Feedback Laws
Frederik Kelbel
Optimal Control Mean Field Approximate Policy Iteration Deep Galerkin Method

June 11, 2024

Formally Verified Approximate Policy Iteration
Maximilian Schäffeler, Mohammad Abdulaziz
Formal Verification Interactive Theorem Approximate Policy Iteration

February 21, 2024

Enhancing Reinforcement Learning Agents with Local Guides
Paul Daoudi, Bogdan Robu, Christophe Prieur, Ludovic Dos Santos, Merwan Barlier
Reinforcement Learning Reinforcement Learning Agent Approximate Policy Iteration

January 3, 2024

Pontryagin Neural Operator for Solving Parametric General-Sum Differential Games
Lei Zhang, Mukesh Ghimire, Zhe Xu, Wenlong Zhang, Yi Ren
Physic Informed Neural Network Differential Game Approximate Policy Iteration

June 19, 2023

On the Model-Misspecification in Reinforcement Learning
Yunfan Li, Lin Yang
Reinforcement Learning Sample Efficient Model Misspecification Approximate Policy Iteration Function Approximator

February 2, 2023

Performance Bounds for Policy-Based Average Reward Reinforcement Learning Algorithms
Yashaswini Murthy, Mehrdad Moharrami, R. Srikant
Reinforcement Learning Algorithm Average Reward Reinforcement Learning Approximate Policy Iteration Performance Bound Average Reward MDPs

October 27, 2022

Confident Approximate Policy Iteration for Efficient Local Planning in $q^\pi$-realizable MDPs
Gellért Weisz, András György, Tadashi Kozuno, Csaba Szepesvári
Optimal Policy Approximate Dynamic Programming Stationary Policy Approximate Policy Iteration

October 21, 2022

online and lightweight kernel-based approximated policy iteration for dynamic p-norm linear adaptive filtering
Yuki Akiyama, Minh Vu, Konstantinos Slavakis
Kernel Hilbert Space P$ Norm Adaptive Filter Approximate Policy Iteration Kernel Based Reinforcement Learning Bellman Mapping

October 20, 2022

Dynamic selection of p-norm in linear adaptive filtering via online kernel-based reinforcement learning
Minh Vu, Yuki Akiyama, Konstantinos Slavakis
Kernel Hilbert Space Linear Ordered Data P$ Norm Adaptive Filter Approximate Policy Iteration Dynamic Selection Kernel Based Reinforcement Learning Bellman Mapping

August 5, 2022

An Approximate Policy Iteration Viewpoint of Actor-Critic Algorithms
Zaiwei Chen, Siva Theja Maguluri
Actor Critic Algorithm Policy Iteration Natural Policy Gradient Reinforcement Learning Problem Approximate Policy Iteration Policy Sampling Policy Based Algorithm

June 28, 2022

Generalized Policy Improvement Algorithms with Theoretically Supported Sample Reuse
James Queeney, Ioannis Ch. Paschalidis, Christos G. Cassandras
Policy Reinforcement Learning Model Free Deep Reinforcement Learning Data Driven Control Approximate Policy Iteration Independent Sampling Generalized Policy Improvement

April 8, 2022

Approximate discounting-free policy evaluation from transient and recurrent states
Vektor Dewanto, Marcus Gallagher
Recurrent Dynamic Approximate Policy Iteration

February 6, 2022

Approximate Policy Iteration with Bisimulation Metrics
Mete Kemertas, Allan Jepson
Bisimulation Metric Approximate Policy Iteration

Approximate Policy Iteration

Papers

Optimal Control of Agent-Based Dynamics under Deep Galerkin Feedback Laws

Formally Verified Approximate Policy Iteration

Enhancing Reinforcement Learning Agents with Local Guides

Pontryagin Neural Operator for Solving Parametric General-Sum Differential Games

On the Model-Misspecification in Reinforcement Learning

Performance Bounds for Policy-Based Average Reward Reinforcement Learning Algorithms

Confident Approximate Policy Iteration for Efficient Local Planning in $q^\pi$-realizable MDPs

online and lightweight kernel-based approximated policy iteration for dynamic p-norm linear adaptive filtering

Dynamic selection of p-norm in linear adaptive filtering via online kernel-based reinforcement learning

An Approximate Policy Iteration Viewpoint of Actor-Critic Algorithms

Generalized Policy Improvement Algorithms with Theoretically Supported Sample Reuse

Approximate discounting-free policy evaluation from transient and recurrent states

Approximate Policy Iteration with Bisimulation Metrics