Gradient Based Optimization

Gradient-based optimization is a cornerstone of modern machine learning, aiming to find optimal parameters for models by iteratively adjusting them along the direction of the gradient of a loss function. Current research focuses on addressing challenges such as escaping local minima in high-dimensional spaces (e.g., through hybridization with metaheuristics or novel learning rate strategies), improving the efficiency and stability of optimization for complex models like Mixture-of-Experts and Bayesian neural networks, and extending gradient-based methods to non-differentiable or discrete problems (e.g., using differentiable surrogates or novel gradient estimation techniques). These advancements are crucial for improving the performance, scalability, and robustness of machine learning models across diverse applications, from natural language processing and computer vision to material science and inverse problem solving.

Papers

February 15, 2024

What to Do When Your Discrete Optimization Is the Size of a Neural Network?
Hugo Silva, Martha White
Neural Network Continual Learning Gradient Based Optimization Size Matter Gradient Information Discrete Optimization Discrete Optimization Problem

February 13, 2024

Corridor Geometry in Gradient-Based Optimization
Benoit Dherin, Mihaela Rosca
Gradient Descent Gradient Flow Convex Optimization Gradient Based Optimization Learning Scheme Spatial Temporal Corridor

February 10, 2024

Guided Sketch-Based Program Induction by Search Gradients
Ahmad Ayaz Amin
Gradient Based Optimization Universal Formula Program Induction

January 17, 2024

Inverse analysis of granular flows using differentiable graph neural network simulator
Yongjin Choi, Krishna Kumar
Neural Network Inverse Problem Gradient Based Optimization Graph Network Simulator Granular Flow Differentiable Graph

January 12, 2024

A Closed-form Solution for Weight Optimization in Fully-connected Feed-forward Neural Networks
Slavisa Tomic, João Pedro Matos-Carvalho, Marko Beko
Back Propagation Gradient Based Optimization Fully Connected Closed Form Solution Weight Optimization

October 31, 2023

Information-Theoretic Trust Regions for Stochastic Gradient-Based Optimization
Philipp Dahlinger, Philipp Becker, Maximilian Hüttenrauch, Gerhard Neumann
Stochastic Gradient Second Order Stochastic Way Gradient Based Optimization Trust Region Stochastic Gradient Based

October 19, 2023

Gradient Descent Fails to Learn High-frequency Functions and Modular Arithmetic
Rustem Takhanov, Maxat Tezekbayev, Artur Pak, Arman Bolatov, Zhenisbek Assylbekov
Gradient Descent Gradient Based Optimization Deep Learning Theory Modular Addition Frequency Function Periodic Function

October 16, 2023

On permutation symmetries in Bayesian neural network posteriors: a variational perspective
Simone Rossi, Ankit Singh, Thomas Hannagan
Bayesian Neural Network Variational Method Loss Landscape Gradient Based Optimization Approximate Inference Approximate Bayesian Inference Permutation Symmetry

October 11, 2023

ROMO: Retrieval-enhanced Offline Model-based Optimization
Mingcheng Chen, Haoran Zhao, Yuxiang Zhao, Hulei Fan, Hongqiao Gao, Yong Yu, Zheng Tian
Constrained Optimization Gradient Based Optimization Model Based Optimization Offline Model Based Optimization

September 18, 2023

Differentiable Boustrophedon Paths That Enable Optimization Via Gradient Descent
Thomas Manzini, Robin Murphy
Optimization Purpose Robotics Domain Gradient Based Optimization Efficient Path Planning

September 9, 2023

A Gentle Introduction to Gradient-Based Optimization and Variational Inequalities for Machine Learning
Neha S. Wadia, Yatin Dandi, Michael I. Jordan
Machine Learning Gradient Descent Gentle Introduction Gradient Based Optimization Variational Inequality Gradient Based Algorithm Monotone Game

September 5, 2023

A skeletonization algorithm for gradient-based optimization
Martin J. Menten, Johannes C. Paetzold, Veronika A. Zimmer, Suprosanna Shit, Ivan Ezhov, Robbie Holland, Monika Probst, Julia A. Schnabel, Daniel Rueckert
Gradient Based Optimization Skeletonization Algorithm Blood Vessel Segmentation

July 26, 2023

Differentiable short-time Fourier transform with respect to the hop length
Maxime Leiber, Yosra Marnissi, Axel Barrau, Mohammed El Badaoui
Gradient Based Optimization Temporal Localization Short Time Fourier Transform

July 24, 2023

DEPHN: Different Expression Parallel Heterogeneous Network using virtual gradient optimization for Multi-task Learning
Menglin Kong, Ri Su, Shaojie Zhao, Muzhou Hou
Multi Task Learning Gradient Based Optimization Task Correlation Shared Model

July 11, 2023

DDGM: Solving inverse problems by Diffusive Denoising of Gradient-based Minimization
Kyle Luther, H. Sebastian Seung
Inverse Problem Denoising Process Denoising Diffusion Gradient Based Optimization Tomographic Reconstruction Diffusion Based Method

June 13, 2023

Differentiating Metropolis-Hastings to Optimize Intractable Densities
Gaurav Arya, Ruben Seyer, Frank Schäfer, Kartik Chandra, Alexander K. Lew, Mathieu Huot, Vikash K. Mansinghka, Jonathan Ragan-Kelley, Christopher Rackauckas, Moritz Schauer
Automatic Differentiation Gradient Based Optimization Intractable Likelihood Metropolis Hastings Low Variance Gradient

February 13, 2023

Optimizing CT Scan Geometries With and Without Gradients
Mareike Thies, Fabian Wagner, Noah Maul, Laura Pfaff, Linda-Sophie Schneider, Christopher Syben, Andreas Maier
Gradient Based Gradient Based Optimization Gradient Free Free Counterpart

February 10, 2023

Fast Learnings of Coupled Nonnegative Tensor Decomposition Using Optimal Gradient and Low-rank Approximation
Xiulin Wang, Jing Liu, Fengyu Cong
Tensor Decomposition Low Rank Approximation Gradient Based Optimization Tensor Data Fast Learning Tensor Decomposition Method Rank Adaptive Tensor Optimization

February 3, 2023

On a continuous time model of gradient descent dynamics and instability in deep learning
Mihaela Rosca, Yan Wu, Chongli Qin, Benoit Dherin
Deep Learning Gradient Descent Core Stability Gradient Based Optimization Continuous Time Model Stable Training Gradient Descent Dynamic

January 25, 2023

Learning Gradients of Convex Functions with Monotone Gradient Networks
Shreyas Chaudhari, Srinivasa Pranav, José M. F. Moura
Gradient Based Convex Function Gradient Based Optimization Convex Objective Monotone Neural Network Neural Network Gradient