Early Stage Convergence

Early stage convergence in machine learning focuses on understanding and improving the initial phases of training algorithms, aiming to accelerate convergence speed and enhance generalization performance. Current research investigates this through the lens of various optimization algorithms (e.g., Adam, SGD, FedProx), model architectures (e.g., transformers, diffusion models), and specific problem domains (e.g., federated learning, collaborative filtering). These studies leverage techniques from dynamical systems theory and optimal transport to establish convergence guarantees and bounds, ultimately contributing to more efficient and robust machine learning systems across diverse applications.

Papers

December 11, 2023

Convergence of the Chambolle-Pock Algorithm in the Absence of Monotonicity
Brecht Evens, Puya Latafat, Panagiotis Patrinos
Early Stage Convergence Primal Dual Partial Monotonicity Lloyd Algorithm Monotone Operator

December 10, 2023

A Note on the Convergence of Denoising Diffusion Probabilistic Models
Sokhna Diarra Mbacke, Omar Rivasplata
Diffusion Model Early Stage Convergence Denoising Diffusion Probabilistic Model Wasserstein Distance Data Generating

December 6, 2023

PCDP-SGD: Improving the Convergence of Differentially Private SGD via Projection in Advance
Haichao Sha, Ruixuan Liu, Yixuan Liu, Hong Chen
Early Stage Convergence Projection Bias Differential Privacy SGD Dp SGD SGD Style

November 30, 2023

November 21, 2023

Federated Learning via Consensus Mechanism on Heterogeneous Data: A New Perspective on Convergence
Shu Zheng, Tiandi Ye, Xiang Li, Ming Gao
Early Stage Convergence Heterogeneous Data Convergence Guarantee New Perspective Data Balancing Consensus Mechanism

November 17, 2023

Using linear initialisation to improve speed of convergence and fully-trained error in Autoencoders
Marcel Marais, Mate Hartstein, George Cevora
Supervised Autoencoder Early Stage Convergence Speed Effect Weight Initialization Rank Initialization

November 7, 2023

Selective Visual Representations Improve Convergence and Generalization for Embodied AI
Ainaz Eftekhar, Kuo-Hao Zeng, Jiafei Duan, Ali Farhadi, Ani Kembhavi, Ranjay Krishna
Strong Generalization Early Stage Convergence Embodied AI Visual Cue Aware Filter

November 2, 2023

On the Convergence of Encoder-only Shallow Transformers
Yongtao Wu, Fanghui Liu, Grigorios G Chrysos, Volkan Cevher
Transformer Based Early Stage Convergence Neural Tangent Kernel Shallow Transformer

October 26, 2023

October 24, 2023

October 23, 2023

ADMM Training Algorithms for Residual Networks: Convergence, Complexity and Parallel Training
Jintao Xu, Yifei Li, Wenxun Xing
Early Stage Convergence Complexity Matter Parallel Training ADMM Algorithm Unfolded D ADMM

October 12, 2023

Every Parameter Matters: Ensuring the Convergence of Federated Learning with Dynamic Heterogeneous Models Reduction
Hanhan Zhou, Tian Lan, Guru Venkataramani, Wenbo Ding
Early Stage Convergence Many Parameter Convergence Analysis Heterogeneous Federated Learning Model Reduction Cross Device Federated Learning

October 9, 2023

On the Convergence of Federated Averaging under Partial Participation for Over-parameterized Neural Networks
Xin Liu, Wei li, Dazhi Zhan, Yu Pan, Xin Ma, Yu Ding, Zhisong Pan
Neural Network Early Stage Convergence Federated Averaging Deep Linear Two Layer ReLU FedAvg Converges Partial Participation

September 28, 2023

Multi-Bellman operator for convergence of $Q$-learning with linear function approximation
Diogo S. Carvalho, Pedro A. Santos, Francisco S. Melo
Early Stage Convergence Linear Function Approximation Q$ Learning Bellman Operator Q$ Learning Algorithm

September 26, 2023

Convergence guarantees for forward gradient descent in the linear regression model
Thijs Bos, Johannes Schmidt-Hieber
Gradient Descent Early Stage Convergence Natural Gradient Regression Model Gradient Free Biological Neural Network Gradient Based Solver

September 23, 2023

RTrack: Accelerating Convergence for Visual Object Tracking via Pseudo-Boxes Exploration
Guotian Zeng, Bi Zeng, Hong Zhang, Jianqi Liu, Qingmao Wei
Early Stage Convergence Single Object Tracking State of the Art Tracker Visual Object

September 21, 2023

Convergence and Recovery Guarantees of Unsupervised Neural Networks for Inverse Problems
Nathan Buskulic, Jalal Fadili, Yvain Quéau
Neural Network Inverse Problem Early Stage Convergence Overparametrization Bound Recovery Guarantee Network Prior

Early Stage Convergence

Papers

Convergence of the Chambolle-Pock Algorithm in the Absence of Monotonicity

A Note on the Convergence of Denoising Diffusion Probabilistic Models

PCDP-SGD: Improving the Convergence of Differentially Private SGD via Projection in Advance

Convergence of Nonconvex PnP-ADMM with MMSE Denoisers

On the convergence of adaptive first order methods: proximal gradient and alternating minimization algorithms

Federated Learning via Consensus Mechanism on Heterogeneous Data: A New Perspective on Convergence

Using linear initialisation to improve speed of convergence and fully-trained error in Autoencoders

Selective Visual Representations Improve Convergence and Generalization for Embodied AI

On the Convergence of Encoder-only Shallow Transformers

Convergence of flow-based generative models via proximal gradient descent in Wasserstein space

On the Convergence of CART under Sufficient Impurity Decrease Condition

On the Convergence and Sample Complexity Analysis of Deep Q-Networks with $\epsilon$-Greedy Exploration

Convergence of Sign-based Random Reshuffling Algorithms for Nonconvex Optimization

ADMM Training Algorithms for Residual Networks: Convergence, Complexity and Parallel Training

Every Parameter Matters: Ensuring the Convergence of Federated Learning with Dynamic Heterogeneous Models Reduction

On the Convergence of Federated Averaging under Partial Participation for Over-parameterized Neural Networks

Multi-Bellman operator for convergence of $Q$-learning with linear function approximation

Convergence guarantees for forward gradient descent in the linear regression model

RTrack: Accelerating Convergence for Visual Object Tracking via Pseudo-Boxes Exploration

Convergence and Recovery Guarantees of Unsupervised Neural Networks for Inverse Problems