Early Stage Convergence

Early stage convergence in machine learning focuses on understanding and improving the initial phases of training algorithms, aiming to accelerate convergence speed and enhance generalization performance. Current research investigates this through the lens of various optimization algorithms (e.g., Adam, SGD, FedProx), model architectures (e.g., transformers, diffusion models), and specific problem domains (e.g., federated learning, collaborative filtering). These studies leverage techniques from dynamical systems theory and optimal transport to establish convergence guarantees and bounds, ultimately contributing to more efficient and robust machine learning systems across diverse applications.

Papers

July 2, 2022

Informed Learning by Wide Neural Networks: Convergence, Generalization and Sampling Complexity
Jianyi Yang, Shaolei Ren
Deep Learning Machine Learning Strong Generalization Domain Knowledge Sample Complexity Early Stage Convergence Wide Neural Network Informed Learning

June 30, 2022

On the Convergence of Distributed Stochastic Bilevel Optimization Algorithms over a Network
Hongchang Gao, Bin Gu, My T. Thai
Network Programming Early Stage Convergence Bilevel Optimization Gradient Estimator Stochastic Bilevel Optimization Strongly Convex

June 22, 2022

June 20, 2022

A Note on the Convergence of Mirrored Stein Variational Gradient Descent under $(L_0,L_1)-$Smoothness Condition
Lukang Sun, Peter Richtárik
Early Stage Convergence Stein Variational Gradient Descent Descent Property

June 15, 2022

Convergence and Price of Anarchy Guarantees of the Softmax Policy Gradient in Markov Potential Games
Dingyang Chen, Qi Zhang, Thinh T. Doan
Policy Gradient Early Stage Convergence Markov Game Curious Price Natural Policy Gradient Stability Guarantee Softmax Policy Markov Potential Game

June 13, 2022

June 12, 2022

Convergence and Stability of Coupled Belief--Strategy Learning Dynamics in Continuous Games
Manxi Wu, Saurabh Amin, Asuman Ozdaglar
Early Stage Convergence Core Stability Learning Dynamic Belief State Strategic Agent Continuous Game Strategy Training

June 10, 2022

On Convergence of FedProx: Local Dissimilarity Invariant Bounds, Non-smoothness and Beyond
Xiao-Tong Yuan, Ping Li
Early Stage Convergence Convergence Guarantee Proximal Point FedProx Algorithm

June 5, 2022

Early Stage Convergence and Global Convergence of Training Mildly Parameterized Neural Networks
Mingze Wang, Chao Ma
Neural Network Loss Function Early Stage Convergence Global Convergence Benign Over Parameterization

June 2, 2022

June 1, 2022

Convergence of Stein Variational Gradient Descent under a Weaker Smoothness Condition
Lukang Sun, Avetik Karagulyan, Peter Richtarik
Early Stage Convergence Langevin Dynamic Fisher Information Stein Variational Gradient Descent Generalized Smoothness

May 27, 2022

On the Convergence of Semi-Relaxed Sinkhorn with Marginal Constraint and OT Distance Gaps
Takumi Fukunaga, Hiroyuki Kasai
Early Stage Convergence Filling Gap Sinkhorn Algorithm Constraint Relaxation Marginal Constraint

May 23, 2022

Semi-Decentralized Federated Learning with Collaborative Relaying
Michal Yemini, Rajarshi Saha, Emre Ozfatura, Deniz Gündüz, Andrea J. Goldsmith
Early Stage Convergence Convergence Rate Learning Algorithm Averaging Algorithm Local Consensus Semi Decentralized Federated

May 17, 2022

On the Convergence of Policy in Unregularized Policy Mirror Descent
Dachao Lin, Zhihua Zhang
Early Stage Convergence Health Policy Recommendation Bregman Divergence Finite Time Convergence Policy Mirror Descent

Early Stage Convergence

Papers

Informed Learning by Wide Neural Networks: Convergence, Generalization and Sampling Complexity

On the Convergence of Distributed Stochastic Bilevel Optimization Algorithms over a Network

Bi-stochastically normalized graph Laplacian: convergence to manifold Laplacian and robustness to outlier noise

A view of mini-batch SGD via generating functions: conditions of convergence, phase transitions, benefit from negative momenta

A Note on the Convergence of Mirrored Stein Variational Gradient Descent under $(L_0,L_1)-$Smoothness Condition

Convergence and Price of Anarchy Guarantees of the Softmax Policy Gradient in Markov Potential Games

Convergence for score-based generative modeling with polynomial complexity

On the Convergence to a Global Solution of Shuffling-Type Gradient Algorithms

Convergence and Stability of Coupled Belief--Strategy Learning Dynamics in Continuous Games

On Convergence of FedProx: Local Dissimilarity Invariant Bounds, Non-smoothness and Beyond

On the Convergence of Optimizing Persistent-Homology-Based Losses

Memory-efficient model-based deep learning with convergence and robustness guarantees

Convergence and sample complexity of natural policy gradient primal-dual methods for constrained MDPs

Early Stage Convergence and Global Convergence of Training Mildly Parameterized Neural Networks

Trajectory of Mini-Batch Momentum: Batch Size Saturation and Convergence in High Dimensions

Faster Rates of Convergence to Stationary Points in Differentially Private Optimization

Convergence of Stein Variational Gradient Descent under a Weaker Smoothness Condition

On the Convergence of Semi-Relaxed Sinkhorn with Marginal Constraint and OT Distance Gaps

Semi-Decentralized Federated Learning with Collaborative Relaying

On the Convergence of Policy in Unregularized Policy Mirror Descent