Nonconvex Optimization

Nonconvex optimization tackles the challenge of finding optimal solutions in scenarios where the objective function possesses multiple local minima, hindering straightforward approaches. Current research emphasizes developing efficient algorithms, such as gradient descent variants (including those with momentum and adaptive learning rates), zeroth-order methods for gradient-free scenarios, and techniques leveraging block coordinate descent or sketching for scalability in high-dimensional problems. These advancements are crucial for addressing numerous applications across machine learning (e.g., training neural networks, robust matrix completion), signal processing, and network analysis, where nonconvex formulations frequently arise. The development of robust and efficient methods for escaping saddle points and achieving global or near-global optima remains a central focus.

Papers

July 8, 2022

Tightening Discretization-based MILP Models for the Pooling Problem using Upper Bounds on Bilinear Terms
Yifu Chen, Christos T. Maravelias, Xiaomin Zhang
Mixed Integer Nonconvex Optimization Upper Bound Simple Pooling MILP Solver

June 27, 2022

Theoretical analysis of Adam using hyperparameters close to one without Lipschitz smoothness
Hideaki Iiduka
Learning Rate Theoretical Analysis Related Hyperparameters Nonconvex Optimization Adaptive Moment Estimation Convergence Rate Analysis

June 1, 2022

Nest Your Adaptive Algorithm for Parameter-Agnostic Nonconvex Minimax Optimization
Junchi Yang, Xiang Li, Niao He
Nonconvex Optimization Adaptive Algorithm Adaptive Optimizers Nest Agent Strongly Concave Minimax Nonconvex Minimax Optimization

May 28, 2022

Efficient-Adam: Communication-Efficient Distributed Adam
Congliang Chen, Li Shen, Wei Liu, Zhi-Quan Luo
Nonconvex Optimization Stochastic Nonconvex Adam Algorithm

April 19, 2022

A Novel Fast Exact Subproblem Solver for Stochastic Quasi-Newton Cubic Regularized Optimization
Jarad Forristal, Joshua Griffin, Wenwen Zhou, Seyedalireza Yektamaram
Stochastic Way Nonconvex Optimization Quasi Newton Method Unconstrained Optimization Adaptive Regularization Cubic Regularization

April 12, 2022

An Algebraically Converging Stochastic Gradient Descent Algorithm for Global Optimization
Björn Engquist, Kui Ren, Yunan Yang
Gradient Descent Stochastic Gradient Descent Global Optimization Nonconvex Optimization Global Convergence Annealing Machine

April 6, 2022

High Probability Bounds for a Class of Nonconvex Algorithms with AdaGrad Stepsize
Ali Kavis, Kfir Yehuda Levy, Volkan Cevher
Convergence Rate True Class Nonconvex Optimization Martingale Difference Accelerated Gradient High Probability Bound Adaptive Scheme

March 29, 2022

Convergence of First-Order Methods for Constrained Nonconvex Optimization with Dependent Data
Ahmet Alacaoglu, Hanbaek Lyu
Early Stage Convergence Stochastic Gradient Gradient Method Nonconvex Optimization Dependent Data First Order Method Smooth Nonconvex Stochastic Proximal Gradient

March 23, 2022

Wasserstein Distributionally Robust Optimization with Wasserstein Barycenters
Tim Tsz-Kit Lau, Han Liu
Robust Optimization Nonconvex Optimization Distributional Robustness Wasserstein Barycenter Robust Optimization Problem Wasserstein Distributionally Robust

March 18, 2022

A Class of Two-Timescale Stochastic EM Algorithms for Nonconvex Latent Variable Models
Belhal Karimi, Ping Li
Expectation Maximization Latent Variable Model True Class Nonconvex Optimization

March 6, 2022

Algorithmic Regularization in Model-free Overparametrized Asymmetric Matrix Factorization
Liwei Jiang, Yudong Chen, Lijun Ding
Gradient Descent Matrix Factorization Low Rank Approximation Nonconvex Optimization Explicit Regularization

February 13, 2022

Efficient Natural Gradient Descent Methods for Large-Scale PDE-Based Optimization Problems
Levon Nurbekyan, Wanzhou Lei, Yunan Yang
Natural Gradient Optimization Problem Nonconvex Optimization Natural Gradient Descent Standard Gradient Descent Numerical Linear Algebra

February 5, 2022

Distributed Learning With Sparsified Gradient Differences
Yicheng Chen, Rick S. Blum, Martin Takac, Brian M. Sadler
LeArning Abstract Gradient Descent Nonconvex Optimization Gradient Sparsification Linear Convergence Rate

February 2, 2022

January 27, 2022

Restarted Nonconvex Accelerated Gradient Descent: No More Polylogarithmic Factor in the $O(\epsilon^{-7/4})$ Complexity
Huan Li, Zhouchen Lin
Gradient Descent Gradient Method Nonconvex Optimization General Nonconvex Accelerated Gradient Descent Accelerated Gradient Method

January 11, 2022

Performance Guarantees for Spectral Initialization in Rotation Averaging and Pose-Graph SLAM
Kevin J. Doherty, David M. Rosen, John J. Leonard
Simultaneous Localization and Mapping Nonconvex Optimization Performance Guarantee Rotation Averaging

December 14, 2021

Minimization of Stochastic First-order Oracle Complexity of Adaptive Methods for Nonconvex Optimization
Hideaki Iiduka
Neural Network Stochastic Gradient Descent Nonconvex Optimization Adaptive Method Batch Size Stochastic First Order Oracle

November 28, 2021

Escape saddle points by a simple gradient-descent based algorithm
Chenyi Zhang, Tongyang Li
Practical Algorithm Gradient Descent Hessian Matrix Nonconvex Optimization Saddle Point Gradient Based Algorithm

November 27, 2021

NCVX: A User-Friendly and Scalable Package for Nonconvex Optimization in Machine Learning
Buyun Liang, Tim Mitchell, Ju Sun
Machine Learning Nonconvex Optimization General Nonconvex Nonsmooth Optimization Nonsmooth Dynamical System Scalable Solution

Nonconvex Optimization

Papers

Tightening Discretization-based MILP Models for the Pooling Problem using Upper Bounds on Bilinear Terms

Theoretical analysis of Adam using hyperparameters close to one without Lipschitz smoothness

Nest Your Adaptive Algorithm for Parameter-Agnostic Nonconvex Minimax Optimization

Efficient-Adam: Communication-Efficient Distributed Adam

A Novel Fast Exact Subproblem Solver for Stochastic Quasi-Newton Cubic Regularized Optimization

An Algebraically Converging Stochastic Gradient Descent Algorithm for Global Optimization

High Probability Bounds for a Class of Nonconvex Algorithms with AdaGrad Stepsize

Convergence of First-Order Methods for Constrained Nonconvex Optimization with Dependent Data

Wasserstein Distributionally Robust Optimization with Wasserstein Barycenters

A Class of Two-Timescale Stochastic EM Algorithms for Nonconvex Latent Variable Models

Algorithmic Regularization in Model-free Overparametrized Asymmetric Matrix Factorization

Efficient Natural Gradient Descent Methods for Large-Scale PDE-Based Optimization Problems

Distributed Learning With Sparsified Gradient Differences

DASHA: Distributed Nonconvex Optimization with Communication Compression, Optimal Oracle Complexity, and No Client Synchronization

3PC: Three Point Compressors for Communication-Efficient Distributed Training and a Better Theory for Lazy Aggregation

Restarted Nonconvex Accelerated Gradient Descent: No More Polylogarithmic Factor in the $O(\epsilon^{-7/4})$ Complexity

Performance Guarantees for Spectral Initialization in Rotation Averaging and Pose-Graph SLAM

Minimization of Stochastic First-order Oracle Complexity of Adaptive Methods for Nonconvex Optimization

Escape saddle points by a simple gradient-descent based algorithm

NCVX: A User-Friendly and Scalable Package for Nonconvex Optimization in Machine Learning