Preconditioned Gradient Descent

Preconditioned gradient descent (PGD) enhances the efficiency and effectiveness of gradient-based optimization methods by incorporating problem-specific information to guide the search for optimal solutions. Current research focuses on adapting PGD to various contexts, including overparameterized neural networks, Wasserstein spaces, and stochastic optimization settings, often employing techniques like Kronecker factorization to manage computational costs. These advancements aim to improve convergence rates, reduce hyperparameter sensitivity, and enable the solution of large-scale optimization problems arising in machine learning and other fields, ultimately leading to more efficient and robust algorithms.

Papers

July 16, 2024

Preconditioned Gradient Descent Finds Over-Parameterized Neural Networks with Sharp Generalization for Nonparametric Regression
Yingzhen Yang
Neural Network Gradient Descent Nonparametric Regression Preconditioned Gradient Descent

June 13, 2024

Mirror and Preconditioned Gradient Descent in Wasserstein Space
Clément Bonet, Théo Uscidda, Adam David, Pierre-Cyril Aubin-Frankowski, Anna Korba
Gradient Descent Non Convex Mirror Descent Etruscan Mirror Wasserstein Space Preconditioned Gradient Descent

February 7, 2024

Curvature-Informed SGD via General Purpose Lie-Group Preconditioners
Omead Pooladzandi, Xi-Lin Li
Adaptive Preconditioner Gradient Noise Hessian Vector Product Preconditioned Gradient Descent

November 28, 2023

Adaptive Step Sizes for Preconditioned Stochastic Gradient Descent
Frederik Köhne, Leonie Kreis, Anton Schiela, Roland Herzog
Stochastic Gradient Descent Second Order Stochastic Optimization Step Size Hyperparameter Free Preconditioned Gradient Descent

September 5, 2023

PROMISE: Preconditioned Stochastic Optimization Methods by Incorporating Scalable Curvature Estimates
Zachary Frangella, Pratik Rathore, Shipu Zhao, Madeleine Udell
Stochastic Gradient Global Convergence Approximate Curvature Gradient Based Optimisation Cross Domain Policy Transfer Preconditioned Gradient Descent

May 30, 2023

KrADagrad: Kronecker Approximation-Domination Gradient Preconditioned Stochastic Optimization
Jonathan Mei, Alexander Moreno, Luke Walters
Second Order Adaptive Preconditioner Factorization Machine Model Precondition Full Matrix AdaGrad Preconditioned Gradient Descent

June 7, 2022

Preconditioned Gradient Descent for Overparameterized Nonconvex Burer--Monteiro Factorization with Global Optimality Certification
Gavin Zhang, Salar Fattahi, Richard Y. Zhang
Gradient Descent General Nonconvex Global Optimality Global Minimum Smooth Convex Burer Monteiro Preconditioned Gradient Descent

September 23, 2019

Geometry, Computation, and Optimality in Stochastic Optimization
Chen Cheng, Daniel Levy, John C. Duchi
Geometric Analysis Stochastic Optimization Computation Method Near Optimality Online Optimization Subgradient Method Preconditioned Gradient Descent