Soft Actor Critic

Soft Actor-Critic (SAC) is a deep reinforcement learning algorithm aiming to learn robust and efficient policies by maximizing both expected reward and policy entropy. Current research focuses on improving SAC's sample efficiency, addressing safety constraints through methods like Lagrangian formulations and meta-gradient optimization, and extending its applicability to various domains including robotics, autonomous driving, and multi-agent systems. These advancements are significant because they enhance the practicality and reliability of reinforcement learning for real-world applications requiring safe and efficient decision-making in complex environments.

Papers

January 9, 2022

An Adaptive Device-Edge Co-Inference Framework Based on Soft Actor-Critic
Tao Niu, Yinglei Teng, Zhu Han, Panpan Zou
Deep Neural Network Deep Reinforcement Learning Soft Actor Critic Device Edge Co Inference

January 4, 2022

Value Functions Factorization with Latent State Information Sharing in Decentralized Multi-Agent Policy Gradients
Hanhan Zhou, Tian Lan, Vaneet Aggarwal
Value Function Latent State Soft Actor Critic Parameter Sharing Value Function Factorization Decentralized Policy Gradient

December 31, 2021

Actor Loss of Soft Actor Critic Explained
Thibault Lahire
Gradient Estimation Soft Actor Critic Reparameterization Method Actor Loss

December 21, 2021

Soft Actor-Critic with Cross-Entropy Policy Optimization
Zhenyang Shi, Surya P. N. Singh
Policy Reinforcement Learning Soft Actor Critic Soft Set Policy Entropy

December 8, 2021

Hyper-parameter optimization based on soft actor critic and hierarchical mixture regularization
Chaoyue Liu, Yulai Zhang
Bayesian Optimization Hyper Parameter Soft Actor Critic Hyper Parameter Optimization Hierarchical Regularisation

December 6, 2021

Target Entropy Annealing for Discrete Soft Actor-Critic
Yaosheng Xu, Dailin Hu, Litian Liang, Stephen McAleer, Pieter Abbeel, Roy Fox
Discrete Environment Soft Actor Critic Policy Entropy Target Entropy

December 1, 2021

Homotopy Based Reinforcement Learning with Maximum Entropy for Autonomous Air Combat
Yiwen Zhu, Zhou Fang, Yuan Zheng, Wenya Wei
Reinforcement Learning Maximum Entropy Soft Actor Critic Air Combat Unmanned Combat Homotopy Optimization