Deep Deterministic Policy Gradient

Deep Deterministic Policy Gradient (DDPG) is a reinforcement learning algorithm used to train agents to perform continuous control tasks by learning optimal policies in complex environments. Current research focuses on improving DDPG's performance in challenging scenarios, such as sparse reward settings, high-dimensional state spaces, and safety-critical applications, often incorporating enhancements like prioritized experience replay, twin delayed DDPG (TD3), and auxiliary tasks. These advancements are significantly impacting various fields, including robotics, autonomous navigation, and resource management, by enabling more robust and efficient control systems in dynamic and uncertain environments.

Papers

July 27, 2022

Distributional Actor-Critic Ensemble for Uncertainty-Aware Continuous Control
Takuya Kanazawa, Haiyan Wang, Chetan Gupta
Reinforcement Learning Uncertainty Quantification Epistemic Uncertainty Deep Deterministic Policy Gradient

June 15, 2022

Autonomous Platoon Control with Integrated Deep Reinforcement Learning and Dynamic Programming
Tong Liu, Lei Lei, Kan Zheng, Kuan Zhang
Reinforcement Learning Deep Reinforcement Learning Dynamic Programming Deep Deterministic Policy Gradient Platoon Control Car Following

June 13, 2022

Computation Offloading and Resource Allocation in F-RANs: A Federated Deep Reinforcement Learning Approach
Lingling Zhang, Yanxiang Jiang, Fu-Chun Zheng, Mehdi Bennis, Xiaohu You
Resource Allocation Federated Reinforcement Learning Deep Deterministic Policy Gradient Computation Offloading Time Varying Network

June 5, 2022

DDPG based on multi-scale strokes for financial time series trading strategy
Jun-Cheng Chen, Cong-Xiao Chen, Li-Juan Duan, Zhi Cai
Deep Reinforcement Learning Multi Scale Financial Time Series Deep Deterministic Policy Gradient Trading Strategy

April 7, 2022

Automatic Parameter Optimization Using Genetic Algorithm in Deep Reinforcement Learning for Robotic Manipulation Tasks
Adarsh Sehgal, Nicholas Ward, Hung La, Sushil Louis
Reinforcement Learning Deep Reinforcement Learning Genetic Algorithm Manipulation Task Deep Deterministic Policy Gradient Learning Agent Hindsight Experience Replay Parameter Optimization

March 24, 2022

Non-Parametric Stochastic Policy Gradient with Strategic Retreat for Non-Stationary Environment
Apan Dastider, Mingjie Lin
Deep Deterministic Policy Gradient Non Stationary Environment Non Parametric Learning Deterministic Policy Gradient Stochastic Policy Gradient Strategic Maneuver

March 8, 2022

Graph Reinforcement Learning for Radio Resource Allocation
Jianyu Zhao, Chenyang Yang
Deep Reinforcement Learning Resource Allocation Deep Deterministic Policy Gradient Graph Reinforcement Learning

February 28, 2022

GA+DDPG+HER: Genetic Algorithm-Based Function Optimizer in Deep Reinforcement Learning for Robotic Manipulation Tasks
Adarsh Sehgal, Nicholas Ward, Hung Manh La, Christos Papachristos, Sushil Louis
Reinforcement Learning Deep Reinforcement Learning Genetic Algorithm Manipulation Task Deep Deterministic Policy Gradient Hindsight Experience Replay

January 12, 2022

Evolutionary Action Selection for Gradient-based Policy Learning
Yan Ma, Tianxing Liu, Bingsheng Wei, Yi Liu, Kang Xu, Wei Li
Deep Reinforcement Learning Action Space Policy Learning Deep Deterministic Policy Gradient Gradient Based Policy

January 3, 2022

3DPG: Distributed Deep Deterministic Policy Gradient Algorithms for Networked Multi-Agent Systems
Adrian Redder, Arunselvan Ramaswamy, Holger Karl
Markov Game Multi Agent Learning Deep Deterministic Policy Gradient 3D G

December 27, 2021

Double Critic Deep Reinforcement Learning for Mapless 3D Navigation of Unmanned Aerial Vehicles
Ricardo Bedin Grando, Junior Costa de Jesus, Victor Augusto Kich, Alisson Henrique Kolling, Paulo Lilles Jorge Drews-Jr
Deep Reinforcement Learning Unmanned Aerial Vehicle Deep RL Deep Deterministic Policy Gradient Mapless Navigation

December 22, 2021

Deep Reinforcement Learning for Optimal Power Flow with Renewables Using Graph Information
Jinhao Li, Ruichang Zhang, Hao Wang, Zhi Liu, Hongyang Lai, Yanru Zhang
Deep Reinforcement Learning Graph Data Power System Renewable Energy Optimal Power Flow Deep Deterministic Policy Gradient Optimal Operation

November 30, 2021

Continuous Control With Ensemble Deep Deterministic Policy Gradients
Piotr Januszewski, Mateusz Olko, Michał Królikowski, Jakub Świątkowski, Marcin Andrychowicz, Łukasz Kuciński, Piotr Miłoś
Deep Reinforcement Learning Continuous Control Deep Deterministic Policy Gradient Continuous Control Task Ensemble Based Double Q Learning

November 2, 2021

Off-Policy Correction for Deep Deterministic Policy Gradient Algorithms via Batch Prioritized Experience Replay
Dogan C. Cicek, Enes Duran, Baturay Saglam, Furkan B. Mutlu, Suleyman S. Kozat
Experience Replay Deep Deterministic Policy Gradient

Deep Deterministic Policy Gradient

Papers

Distributional Actor-Critic Ensemble for Uncertainty-Aware Continuous Control

Autonomous Platoon Control with Integrated Deep Reinforcement Learning and Dynamic Programming

Computation Offloading and Resource Allocation in F-RANs: A Federated Deep Reinforcement Learning Approach

DDPG based on multi-scale strokes for financial time series trading strategy

Automatic Parameter Optimization Using Genetic Algorithm in Deep Reinforcement Learning for Robotic Manipulation Tasks

Non-Parametric Stochastic Policy Gradient with Strategic Retreat for Non-Stationary Environment

Graph Reinforcement Learning for Radio Resource Allocation

GA+DDPG+HER: Genetic Algorithm-Based Function Optimizer in Deep Reinforcement Learning for Robotic Manipulation Tasks

Evolutionary Action Selection for Gradient-based Policy Learning

3DPG: Distributed Deep Deterministic Policy Gradient Algorithms for Networked Multi-Agent Systems

Double Critic Deep Reinforcement Learning for Mapless 3D Navigation of Unmanned Aerial Vehicles

Deep Reinforcement Learning for Optimal Power Flow with Renewables Using Graph Information

Continuous Control With Ensemble Deep Deterministic Policy Gradients

Off-Policy Correction for Deep Deterministic Policy Gradient Algorithms via Batch Prioritized Experience Replay