Hessian Vector Product

Hessian vector products (HVPs) are crucial for approximating second-order information in machine learning optimization, enabling more efficient and robust training of complex models. Current research focuses on developing efficient algorithms for computing HVPs and their inverses, particularly within the context of bilevel optimization, stochastic gradient descent acceleration, and influence function calculations, often employing techniques like Lanczos methods, Lie group preconditioning, and random sketching to improve scalability and accuracy. These advancements are significant because efficient HVP computations are essential for improving the speed and stability of training large-scale models and for gaining deeper insights into model behavior and training dynamics.

Papers

September 25, 2024

Revisiting inverse Hessian vector products for calculating influence functions
Yegor Klochkov, Yang Liu
Second Order Influence Function Inverse Task Hessian Vector Product Bregman Proximal

June 18, 2024

Accelerated Stochastic Min-Max Optimization Based on Bias-corrected Momentum
Haoyuan Cai, Sulaiman A. Alghunaim, Ali H. Sayed
Convergence Rate General Nonconvex Bias Correction Iteration Complexity Hessian Vector Product Strongly Concave Minimax

April 4, 2024

LancBiO: dynamic Lanczos-aided bilevel optimization via Krylov subspace
Bin Gao, Yan Yang, Ya-xiang Yuan
Bilevel Optimization Hessian Vector Product Krylov Subspace

February 19, 2024

Stochastic Hessian Fittings with Lie Groups
Xi-Lin Li
Stochastic Gradient Descent Hessian Matrix Lie Group Hessian Vector Product

February 7, 2024

Curvature-Informed SGD via General Purpose Lie-Group Preconditioners
Omead Pooladzandi, Xi-Lin Li
Adaptive Preconditioner Gradient Noise Hessian Vector Product Preconditioned Gradient Descent

February 6, 2024

Efficient Sketches for Training Data Attribution and Studying the Loss Landscape
Andrea Schioppa
Hessian Matrix Loss Landscape Random Projection Hessian Vector Product Training Data Attribution

October 28, 2023

On Training Implicit Meta-Learning With Applications to Inductive Weighing in Consistency Regularization
Fady Rezk
Financial Application Consistency Regularization Implicit Neural Network Weight Freezing Hessian Vector Product Order Gradient Modern Deep Learning Model Implicit Gradient

October 23, 2023

Series of Hessian-Vector Products for Tractable Saddle-Free Newton Optimisation of Neural Networks
Elre T. Oldewage, Ross M. Clarke, José Miguel Hernández-Lobato
Neural Network Hessian Matrix Second Order TV Show Newton Method Quasi Newton Method Hessian Vector Product

August 22, 2023

Understanding Hessian Alignment for Domain Generalization
Sobhan Hemati, Guojun Zhang, Amir Estiri, Xi Chen
Domain Generalization Distribution Generalization Hessian Matrix Gradient Alignment Hessian Vector Product

June 26, 2023

Near-Optimal Nonconvex-Strongly-Convex Bilevel Optimization with Fully First-Order Oracles
Lesi Chen, Yaohua Ma, Jingzhao Zhang
Bilevel Optimization Hessian Vector Product

May 25, 2023

ADLER -- An efficient Hessian-based strategy for adaptive learning rate
Dario Balboni, Davide Bacciu
Learning Rate Hessian Matrix Hessian Vector Product Local Approximation Positive Semi Definite

February 20, 2023

Nystrom Method for Accurate and Scalable Implicit Differentiation
Ryuichiro Hataya, Makoto Yamada
Bilevel Optimization Conjugate Gradient Implicit Differentiation Hessian Vector Product Large Scale Hyperparameter Optimization

December 8, 2022

Statistical and Computational Guarantees for Influence Diagnostics
Jillian Fisher, Lang Liu, Krishna Pillutla, Yejin Choi, Zaid Harchaoui
Influence Function Hessian Vector Product Influence Estimation Influence Indicator Influential Data

November 8, 2022

Black Box Lie Group Preconditioners for SGD
Xilin Li
Stochastic Gradient Descent Adaptive Preconditioner Hessian Vector Product

October 26, 2022

Adaptive scaling of the learning rate by second order automatic differentiation
Frédéric de Gournay, Alban Gossard
Optimization Purpose Natural Gradient Learning Rate Second Order Gradient Method Automatic Differentiation Hessian Vector Product

October 4, 2022

Zeroth-Order Negative Curvature Finding: Escaping Saddle Points without Gradients
Hualin Zhang, Huan Xiong, Bin Gu
Saddle Point Hessian Vector Product Graph Curvature Nonconvex Nonconcave Problem

June 17, 2022

FedNew: A Communication-Efficient and Privacy-Preserving Newton-Type Method for Federated Learning
Anis Elgabli, Chaouki Ben Issaid, Amrit S. Bedi, Ketan Rajawat, Mehdi Bennis, Vaneet Aggarwal
Hessian Matrix Gradient Information Newton Method Fast Convergence Hessian Vector Product Newton Type Method

May 27, 2022

Will Bilevel Optimizers Benefit from Loops
Kaiyi Ji, Mingrui Liu, Yingbin Liang, Lei Ying
Bilevel Optimization Convergence Analysis Hessian Vector Product Gradient Complexity Level Loop

May 20, 2022

Revisiting GANs by Best-Response Constraint: Perspective, Methodology, and Application
Risheng Liu, Jiaxin Gao, Xuan Liu, Xin Fan
Generative Adversarial Network Application Proficiency NCD Method Visual Perspective Hessian Vector Product Best Response Multi Level Optimization Single Level Optimization

December 15, 2021

Rethinking Influence Functions of Neural Networks in the Over-parameterized Regime
Rui Zhang, Shihua Zhang
Neural Network Black Box Neural Tangent Kernel Influence Function Regularization Loss Hessian Vector Product Parameterized Regime