Natural Gradient

Natural gradients are a powerful tool in optimization, aiming to improve the efficiency and stability of training complex models by accounting for the underlying geometry of the parameter space. Current research focuses on applying natural gradient methods to diverse areas, including distributed learning (e.g., through gradient compression and efficient client selection), inverse problems (using diffusion models), and neural network training (e.g., via regularization and novel optimizers like DiffGrad and AdEMAMix). These advancements have significant implications for improving the performance and robustness of machine learning models across various applications, from image processing and medical image analysis to scientific computing and federated learning.

Papers

June 7, 2022

Signal Propagation in Transformers: Theoretical Perspectives and the Role of Rank Collapse
Lorenzo Noci, Sotiris Anagnostidis, Luca Biggio, Antonio Orvieto, Sidak Pal Singh, Aurelien Lucchi
Transformer Megatron Decepticons Integral Role Natural Gradient Gradient Norm Self Attention Layer Propagation Environment Rank Collapse Theoretical Consideration Effective Depth Up Scaling

June 1, 2022

Optimization with Access to Auxiliary Information
El Mahdi Chayti, Sai Praneeth Karimireddy
Transfer Learning Optimization Purpose Natural Gradient Hessian Matrix Information Access Auxiliary Information

May 31, 2022

Predicting Day-Ahead Stock Returns using Search Engine Query Volumes: An Application of Gradient Boosted Decision Trees to the S&P 100
Christopher Bockel-Rickermann
Decision Tree Natural Gradient Financial Market Market Data Stock Return Prediction Portfolio Performance Intraday Market

May 24, 2022

Regret-Aware Black-Box Optimization with Natural Gradients, Trust-Regions and Entropy Control
Maximilian Hüttenrauch, Gerhard Neumann
Policy Gradient Natural Gradient Stochastic Optimization Trust Region Fitness Function

May 23, 2022

Quasi Black-Box Variational Inference with Natural Gradients for Bayesian Learning
Martin Magris, Mostafa Shabani, Alexandros Iosifidis
Natural Gradient Bayesian Learning Variational Posterior Inference Problem Black Box Variational Inference

May 22, 2022

May 19, 2022

May 13, 2022

A Unified Framework for Implicit Sinkhorn Differentiation
Marvin Eisenberger, Aysim Toker, Laura Leal-Taixé, Florian Bernard, Daniel Cremers
Unified Framework Natural Gradient Automatic Differentiation Sinkhorn Algorithm Gradient Approximation Implicit Differentiation

May 10, 2022

A Communication-Efficient Distributed Gradient Clipping Algorithm for Training Deep Neural Networks
Mingrui Liu, Zhenxun Zhuang, Yunwei Lei, Chunyang Liao
Practical Algorithm Stochastic Gradient Descent Natural Gradient Communication Efficient Training Deep Communication Cost Slow Convergence Continuous Gradient

May 5, 2022

April 14, 2022

Gradient boosting for convex cone predict and optimize problems
Andrew Butler, Roy H. Kwon
Natural Gradient Gradient Boosting Prediction Method Counterfactual Regret Convex Regression Decision Optimization

April 10, 2022

Measuring the False Sense of Security
Carlos Gomes
Natural Gradient Security Related Adversarial DEfense False Sense Attack Framework Gradient Masking

March 22, 2022

Gradient flows and randomised thresholding: sparse inversion and classification
Jonas Latz
Classification Code Gradient Descent Natural Gradient Automatic Thresholding Non Smooth Sparse Reconstruction

March 17, 2022

Monotonic Differentiable Sorting Networks
Felix Petersen, Christian Borgelt, Hilde Kuehne, Oliver Deussen
Natural Gradient Gradient Based Optimization Swap Distance Minimization Differentiable Sorting

March 10, 2022

neos: End-to-End-Optimised Summary Statistics for High Energy Physics
Nathan Simpson, Lukas Heinrich
Neural Network Deep Learning Gradient Descent Natural Gradient High Energy Physic

February 21, 2022

MSTGD:A Memory Stochastic sTratified Gradient Descent Method with an Exponential Convergence Rate
Aixiang, Chen, Jinting Zhang, Zanbo Zhang, Zhihong Li
Natural Gradient Variance Reduction Exponential Convergence Rate Sample Gradient Stratified Sampling Gradient Covariance

February 17, 2022

Gradients without Backpropagation
Atılım Güneş Baydin, Barak A. Pearlmutter, Don Syme, Frank Wood, Philip Torr
Gradient Descent Back Propagation Natural Gradient Forward Gradient Mode Automatic Differentiation