Gradient Based Optimization

Gradient-based optimization is a cornerstone of modern machine learning, aiming to find optimal parameters for models by iteratively adjusting them along the direction of the gradient of a loss function. Current research focuses on addressing challenges such as escaping local minima in high-dimensional spaces (e.g., through hybridization with metaheuristics or novel learning rate strategies), improving the efficiency and stability of optimization for complex models like Mixture-of-Experts and Bayesian neural networks, and extending gradient-based methods to non-differentiable or discrete problems (e.g., using differentiable surrogates or novel gradient estimation techniques). These advancements are crucial for improving the performance, scalability, and robustness of machine learning models across diverse applications, from natural language processing and computer vision to material science and inverse problem solving.

Papers

January 3, 2023

WLD-Reg: A Data-dependent Within-layer Diversity Regularizer
Firas Laakom, Jenni Raitoharju, Alexandros Iosifidis, Moncef Gabbouj
Neural Network Multi Layer Neural Network Model Gradient Based Optimization Intermediate Layer Diversity Regularizer

December 22, 2022

Re-basin via implicit Sinkhorn differentiation
Fidel A. Guerrero Peña, Heitor Rapela Medeiros, Thomas Dubail, Masih Aminbeidokhti, Eric Granger, Marco Pedersoli
Optimal Transport Gradient Based Optimization Machine Permutation Sinkhorn Algorithm Model Re Basin

December 19, 2022

TextGrad: Advancing Robustness Evaluation in NLP by Gradient-Driven Optimization
Bairu Hou, Jinghan Jia, Yihua Zhang, Guanhua Zhang, Yang Zhang, Sijia Liu, Shiyu Chang
Adversarial Example Adversarial Robustness NLP Field Adversarial DEfense Robustness Evaluation Gradient Based Optimization Robustness Evaluation Framework

November 21, 2022

Boosting the Transferability of Adversarial Attacks with Global Momentum Initialization
Jiafeng Wang, Zhaoyu Chen, Kaixun Jiang, Dingkang Yang, Lingyi Hong, Pinxue Guo, Haijing Guo, Wenqiang Zhang
Adversarial Attack Adversarial Example Task Transferability Gradient Based Optimization Transfer Attack Gradient Vanishing

November 10, 2022

Regression as Classification: Influence of Task Formulation on Neural Network Features
Lawrence Stewart, Francis Bach, Quentin Berthet, Jean-Philippe Vert
Neural Network Classification Code Novel Regression Cross Entropy Loss External Influence Gradient Method Gradient Based Optimization Two Layer ReLU Task Formulation

October 25, 2022

Search for Concepts: Discovering Visual Concepts Using Direct Optimization
Pradyumna Reddy, Paul Guerrero, Niloy J. Mitra
Search Query Concept Identification Visual Concept Gradient Based Optimization Learning Decomposition Amortized Inference Unrolled Optimization Direct Optimization

October 14, 2022

September 25, 2022

Gradient Optimization for Single-State RMDPs
Keith Badger
Autonomous Driving Data Driven Adversarial Learning Gradient Based Optimization Data Driven Model Data Driven Decision MDP Model

September 16, 2022

FairGBM: Gradient Boosting with Fairness Constraints
André F Cruz, Catarina Belém, Sérgio Jesus, João Bravo, Pedro Saleiro, Pedro Bizarro
Natural Gradient Fairness Constraint Fair Machine Learning Gradient Based Optimization Dual Ascent

August 19, 2022

Game-Theoretic Algorithms for Conditional Moment Matching
Gokul Swamy, Sanjiban Choudhury, J. Andrew Bagnell, Zhiwei Steven Wu
Game Theoretic Gradient Based Optimization Instrumental Variable Econometric Model Moment Matching Conditional Moment Restriction

June 23, 2022

Optimizing Two-way Partial AUC with an End-to-end Framework
Zhiyong Yang, Qianqian Xu, Shilong Bao, Yuan He, Xiaochun Cao, Qingming Huang
End to End Gradient Based Optimization ROC Curve Partial AUC Surrogate Optimization

June 4, 2022

Combinatorial optimization for low bit-width neural networks
Han Zhou, Aida Ashrafi, Matthew B. Blaschko
Submodular Maximization Gradient Based Optimization Combinatorial Optimization Binary Weight Greedy Coordinate

April 29, 2022

Por Qu\'e N\~ao Utiliser Alla Spr{\aa}k? Mixed Training with Gradient Optimization in Few-Shot Cross-Lingual Transfer
Haoran Xu, Kenton Murray
NLP Task Cross Lingual Transfer Gradient Based Optimization Language Specific Target Language Training Time Shot Cross Lingual Mixed Supervised Learning

April 5, 2022

Imaging Conductivity from Current Density Magnitude using Neural Networks
Bangti Jin, Xiyao Li, Xiliang Lu
Neural Network Gradient Based Optimization Electrical Conductivity Conductivity Imaging

March 23, 2022

March 17, 2022

Monotonic Differentiable Sorting Networks
Felix Petersen, Christian Borgelt, Hilde Kuehne, Oliver Deussen
Natural Gradient Gradient Based Optimization Swap Distance Minimization Differentiable Sorting

March 3, 2022

Learning Group Importance using the Differentiable Hypergeometric Distribution
Thomas M. Sutter, Laura Manduchi, Alain Ryser, Julia E. Vogt
Weakly Supervised Learning Gradient Based Optimization Group Learning Hypergeometric Distribution

February 8, 2022

Residual Aligned: Gradient Optimization for Non-Negative Image Synthesis
Flora Yu Shen, Katie Luo, Guandao Yang, Harald Haraldsson, Serge Belongie
Image Synthesis High Dynamic Range Gradient Based Optimization Optical Illusion