Saddle to Saddle Dynamic

Saddle-to-saddle dynamics describe the trajectory of optimization algorithms, particularly gradient descent, as they navigate the loss landscape of complex models like neural networks. Current research focuses on understanding this phenomenon in various architectures, including two-layer neural networks and diagonal linear networks, often employing techniques like Sharpness-Aware Minimization (SAM) to improve generalization. This research is crucial for improving the efficiency and robustness of training algorithms, impacting fields ranging from deep learning to constrained reinforcement learning and even differential privacy analysis where accurate composition of privacy guarantees is essential.

Papers

May 26, 2024

Geometry of Critical Sets and Existence of Saddle Branches for Two-layer Neural Networks
Leyang Zhang, Yaoyu Zhang, Tao Luo
Neural Network Geometric Analysis Two Layer Neural Network Saddle to Saddle Dynamic

May 22, 2024

SADDLe: Sharpness-Aware Decentralized Deep Learning with Heterogeneous Data
Sakshi Choudhary, Sai Aparna Aketi, Kaushik Roy
Deep Learning Algorithm Heterogeneous Data Sharpness Aware Minimization Communication Compression Decentralized Training Decentralized Deep Learning Saddle to Saddle Dynamic

February 14, 2024

Directional Convergence Near Small Initializations and Saddles in Two-Homogeneous Neural Networks
Akshay Kumar, Jarvis Haupt
Neural Network Homogeneous Neural Network Gradient Flow Dynamic Saddle to Saddle Dynamic

May 21, 2023

Understanding Multi-phase Optimization Dynamics and Rich Nonlinear Behaviors of ReLU Networks
Mingze Wang, Chao Ma
Gradient Flow Nonlinear Model ReLU Network Two Layer ReLU Dynamic Optimization Saddle to Saddle Dynamic

April 2, 2023

Saddle-to-Saddle Dynamics in Diagonal Linear Networks
Scott Pesme, Nicolas Flammarion
Incremental Learning Gradient Flow Regularization Path Diagonal Linear Network Saddle to Saddle Dynamic

February 21, 2023

SGD learning on neural networks: leap complexity and saddle-to-saddle dynamics
Emmanuel Abbe, Enric Boix-Adsera, Theodor Misiakiewicz
Neural Network Stochastic Gradient Descent Fully Connected Neural Network Gradient Complexity Saddle to Saddle Dynamic Isotropic Gaussian Complexity Scaling

December 3, 2022

Constrained Reinforcement Learning via Dissipative Saddle Flow Dynamics
Tianqi Zheng, Pengcheng You, Enrique Mallada
Primal Dual Constrained Reinforcement Learning Gradient Descent Ascent Stochastic Gradient Descent Ascent Saddle to Saddle Dynamic

August 20, 2022

The Saddle-Point Accountant for Differential Privacy
Wael Alghamdi, Shahab Asoodeh, Flavio P. Calmon, Juan Felipe Gomez, Oliver Kosut, Lalitha Sankar, Fei Wei
Differential Privacy Privacy Guarantee Privacy Mechanism Saddle to Saddle Dynamic

June 9, 2022

Analytical Composition of Differential Privacy via the Edgeworth Accountant
Hua Wang, Sheng Gao, Huanyu Zhang, Milan Shen, Weijie J. Su
Differential Privacy Private Algorithm Differential Privacy Guarantee Analytical Approach Saddle to Saddle Dynamic