Early Stage Convergence

Early stage convergence in machine learning focuses on understanding and improving the initial phases of training algorithms, aiming to accelerate convergence speed and enhance generalization performance. Current research investigates this through the lens of various optimization algorithms (e.g., Adam, SGD, FedProx), model architectures (e.g., transformers, diffusion models), and specific problem domains (e.g., federated learning, collaborative filtering). These studies leverage techniques from dynamical systems theory and optimal transport to establish convergence guarantees and bounds, ultimately contributing to more efficient and robust machine learning systems across diverse applications.

Papers

April 18, 2024

The Dog Walking Theory: Rethinking Convergence in Federated Learning
Kun Zhai, Yifeng Gao, Xingjun Ma, Difan Zou, Guangnan Ye, Yu-Gang Jiang
Federated Learning Theoretical Understanding Early Stage Convergence Novel Way

April 12, 2024

Convergence of coordinate ascent variational inference for log-concave measures via optimal transport
Manuel Arnese, Daniel Lacker
Optimal Transport Variational Inference Early Stage Convergence Mean Field Coordinate Descent Log Concave Greedy Coordinate

April 8, 2024

On the Convergence of Continual Learning with Adaptive Methods
Seungyub Han, Yeongmo Kim, Taehyun Cho, Jungwoo Lee
Continual LEArning Catastrophic Forgetting Continual Learning Early Stage Convergence Adaptive Method

April 4, 2024

Convergence to Nash Equilibrium and No-regret Guarantee in (Markov) Potential Games
Jing Dong, Baoxiang Wang, Yaoliang Yu
Early Stage Convergence Nash Equilibrium Bandit Feedback Sublinear Regret Regret Guarantee Frank Wolfe Algorithm Markov Model Potential Game

April 1, 2024

Metric Learning to Accelerate Convergence of Operator Splitting Methods for Differentiable Parametric Programming
Ethan King, James Kotary, Ferdinando Fioretto, Jan Drgona
Early Stage Convergence Metric Learning Constrained Optimization Proximal Gradient Differentiable Optimization Operator Splitting Proximal Splitting

March 31, 2024

Convergence of Continuous Normalizing Flows for Learning Probability Distributions
Yuan Gao, Jian Huang, Yuling Jiao, Shurong Zheng
Early Stage Convergence Normalizing Flow Convergence Analysis Gaussian Distribution Non Asymptotic Learning Probability Distribution

March 25, 2024

March 22, 2024

On the Convergence of Adam under Non-uniform Smoothness: Separability from SGDM and Beyond
Bohan Wang, Huishuai Zhang, Qi Meng, Ruoyu Sun, Zhi-Ming Ma, Wei Chen
Gradient Descent Stochastic Gradient Descent Early Stage Convergence First Order Faster Convergence Non Uniform Linear Separability

March 18, 2024

Convergence of Kinetic Langevin Monte Carlo on Lie groups
Lingkai Kong, Molei Tao
Early Stage Convergence Langevin Dynamic Lie Group Momentum Based Langevin Monte Carlo Dynamic Sampling Langevin Sampler

March 13, 2024

On the Convergence of Locally Adaptive and Scalable Diffusion-Based Sampling Methods for Deep Bayesian Neural Network Posteriors
Tim Rensmeyer, Oliver Niggemann
Uncertainty Quantification Early Stage Convergence Bayesian Neural Network Markov Chain Monte Carlo Posterior Inference Diffusion Sampling Uncertainty Modeling Local Adaptivity

March 8, 2024

Safe Execution of Learned Orientation Skills with Conic Control Barrier Functions
Zheng Shen, Matteo Saveriano, Fares J. Abu-Dakka, Sami Haddadin
Early Stage Convergence Control Barrier Function Expert Demonstration Navigation Skill Conic Constraint Assisted Teleoperation

March 7, 2024

Convergence of Some Convex Message Passing Algorithms to a Fixed Point
Vaclav Voracek, Tomas Werner
Early Stage Convergence Message Passing Diffusion Policy Fixed Point Coordinate Descent

March 6, 2024

March 5, 2024

March 4, 2024

On the impact of measure pre-conditionings on general parametric ML models and transfer learning via domain adaptation
Joaquín Sánchez García
Domain Adaptation Global Impact Early Stage Convergence Agent Smith Linear Convergence Novel Technique Implicit Conditioning Method

March 1, 2024

Reusing Historical Trajectories in Natural Policy Gradient via Importance Sampling: Convergence and Convergence Rate
Yifan Lin, Yuhao Wang, Enlu Zhou
Reinforcement Learning Policy Gradient Early Stage Convergence Policy OpTimization Convergence Rate Importance Sampling Natural Policy Gradient Trust Region Policy Optimization

February 29, 2024

On the Convergence of Federated Learning Algorithms without Data Similarity
Ali Beikmohammadi, Sarit Khirirat, Sindri Magnússon
Federated Learning Early Stage Convergence Slow Convergence Federated Learning Algorithm Convergent Algorithm Data Similarity

Early Stage Convergence

Papers

The Dog Walking Theory: Rethinking Convergence in Federated Learning

Convergence of coordinate ascent variational inference for log-concave measures via optimal transport

On the Convergence of Continual Learning with Adaptive Methods

Convergence to Nash Equilibrium and No-regret Guarantee in (Markov) Potential Games

Metric Learning to Accelerate Convergence of Operator Splitting Methods for Differentiable Parametric Programming

Convergence of Continuous Normalizing Flows for Learning Probability Distributions

Convergence of a model-free entropy-regularized inverse reinforcement learning algorithm

On the rates of convergence for learning with convolutional neural networks

On the Convergence of Adam under Non-uniform Smoothness: Separability from SGDM and Beyond

Convergence of Kinetic Langevin Monte Carlo on Lie groups

On the Convergence of Locally Adaptive and Scalable Diffusion-Based Sampling Methods for Deep Bayesian Neural Network Posteriors

Safe Execution of Learned Orientation Skills with Conic Control Barrier Functions

Convergence of Some Convex Message Passing Algorithms to a Fixed Point

Directional Smoothness and Gradient Methods: Convergence and Adaptivity

Accelerating Convergence of Score-Based Diffusion Models, Provably

PPS-QMIX: Periodically Parameter Sharing for Accelerating Convergence of Multi-Agent Reinforcement Learning

MUSIC: Accelerated Convergence for Distributed Optimization With Inexact and Exact Methods

On the impact of measure pre-conditionings on general parametric ML models and transfer learning via domain adaptation

Reusing Historical Trajectories in Natural Policy Gradient via Importance Sampling: Convergence and Convergence Rate

On the Convergence of Federated Learning Algorithms without Data Similarity