Gradient Based Optimization

Gradient-based optimization is a cornerstone of modern machine learning, aiming to find optimal parameters for models by iteratively adjusting them along the direction of the gradient of a loss function. Current research focuses on addressing challenges such as escaping local minima in high-dimensional spaces (e.g., through hybridization with metaheuristics or novel learning rate strategies), improving the efficiency and stability of optimization for complex models like Mixture-of-Experts and Bayesian neural networks, and extending gradient-based methods to non-differentiable or discrete problems (e.g., using differentiable surrogates or novel gradient estimation techniques). These advancements are crucial for improving the performance, scalability, and robustness of machine learning models across diverse applications, from natural language processing and computer vision to material science and inverse problem solving.

Papers

January 27, 2022

Distributed gradient-based optimization in the presence of dependent aperiodic communication
Adrian Redder, Arunselvan Ramaswamy, Holger Karl
Stochastic Gradient Descent Speech Presence Gradient Based Time Varying Optimization Algorithm Gradient Based Optimization Time Varying Network Convergent Algorithm

January 12, 2022

Implicit Bias of MSE Gradient Optimization in Underparameterized Neural Networks
Benjamin Bowman, Guido Montufar
Gradient Flow Neural Tangent Kernel Implicit Bias Gradient Based Optimization Eigenfunction Decomposition

December 24, 2021

DARTS without a Validation Set: Optimizing the Marginal Likelihood
Miroslav Fil, Binxin Ru, Clare Lyle, Yarin Gal
Neural Architecture Search Search Space Gradient Based Optimization Marginal Likelihood Generalization Phase Transition

December 16, 2021

GOSH: Task Scheduling Using Deep Surrogate Models in Fog Computing Environments
Shreshth Tuli, Giuliano Casale, Nicholas R. Jennings
Surrogate Model Task Scheduling Gradient Based Optimization Fog Computing Surrogate Modelling Deep Surrogate Heteroscedastic Regression

November 25, 2021

Gradient Based Optimization

Papers

Distributed gradient-based optimization in the presence of dependent aperiodic communication

Implicit Bias of MSE Gradient Optimization in Underparameterized Neural Networks

DARTS without a Validation Set: Optimizing the Marginal Likelihood

GOSH: Task Scheduling Using Deep Surrogate Models in Fog Computing Environments

Joint inference and input optimization in equilibrium networks

Learning dynamical systems from data: A simple cross-validation perspective, part III: Irregularly-Sampled Time Series