Sharpness Aware Minimization

Sharpness-Aware Minimization (SAM) is an optimization technique aiming to improve the generalization ability of machine learning models by finding "flatter" minima in the loss landscape, reducing overfitting and enhancing robustness. Current research focuses on refining SAM's algorithm, including adaptive radius selection, bilateral sharpness estimation, and integrating it with other techniques like federated learning and uncertainty quantification, often applied to models such as transformers and convolutional neural networks. This approach holds significant promise for improving the performance and reliability of machine learning models across diverse applications, particularly in areas like medical image analysis and time series forecasting where generalization is crucial.

Papers

March 1, 2023

AdaSAM: Boosting Sharpness-Aware Minimization with Adaptive Learning Rate and Momentum for Training Deep Neural Networks
Hao Sun, Li Shen, Qihuang Zhong, Liang Ding, Shixiang Chen, Jingwei Sun, Jing Li, Guangzhong Sun, Dacheng Tao
Learning Rate Stochastic Gradient Sharpness Aware Minimization Residual Momentum Training Deep Minimization Problem

February 23, 2023

On Statistical Properties of Sharpness-Aware Minimization: Provable Guarantees
Kayhan Behdin, Rahul Mazumder
Deep Neural Network Gradient Descent Sharpness Aware Minimization Neural Network Generalization Provable Guarantee Statistical Property

February 19, 2023

mSAM: Micro-Batch-Averaged Sharpness-Aware Minimization
Kayhan Behdin, Qingquan Song, Aman Gupta, Sathiya Keerthi, Ayan Acharya, Borja Ocejo, Gregory Dexter, Rajiv Khanna, David Durfee, Rahul Mazumder
Adversarial Perturbation Generalization Performance Sharpness Aware Minimization

February 17, 2023

SAM operates far from home: eigenvalue regularization as a dynamical phenomenon
Atish Agarwala, Yann N. Dauphin
Hessian Matrix Sharpness Aware Minimization Sharp Minimum

January 27, 2023

Exploring the Effect of Multi-step Ascent in Sharpness-Aware Minimization
Hoki Kim, Jinseong Park, Yujin Choi, Woojin Lee, Jaewook Lee
Mixed Effect Sharpness Aware Minimization Gradient Ascent

January 19, 2023

An SDE for Modeling SAM: Theory and Insights
Enea Monzio Compagnoni, Luca Biggio, Antonio Orvieto, Frank Norbert Proske, Hans Kersting, Aurelien Lucchi
Stochastic Gradient Descent Real Time Theoretical Understanding DCU Insight AQ Hessian Matrix Sharpness Aware Minimization Human Model Diffusion SDE Continuous Time Model

January 16, 2023

Stability Analysis of Sharpness-Aware Minimization
Hoki Kim, Jinseong Park, Yujin Choi, Jaewook Lee
Gradient Descent Sharpness Aware Minimization Stochastic Dynamical System Stability Analysis Unstable Convergence

December 28, 2022

Escaping Saddle Points for Effective Generalization on Class-Imbalanced Data
Harsh Rangwani, Sumukh K Aithal, Mayank Mishra, R. Venkatesh Babu
Sharpness Aware Minimization Saddle Point Generalization Capability Class Loss Margin Based Class Imbalanced Data Imbalance Learning

December 7, 2022

Improved Deep Neural Network Generalization Using m-Sharpness-Aware Minimization
Kayhan Behdin, Qingquan Song, Aman Gupta, David Durfee, Ayan Acharya, Sathiya Keerthi, Rahul Mazumder
Adversarial Perturbation Generalization Performance Sharpness Aware Minimization Neural Network Generalization Modern Deep Learning Model

November 21, 2022

Efficient Generalization Improvement Guided by Random Weight Perturbation
Tao Li, Weihao Yan, Zehao Lei, Yingwen Wu, Kun Fang, Ming Yang, Xiaolin Huang
Adversarial Perturbation Sharpness Aware Minimization Weight Perturbation Sharpness Measure

November 18, 2022

SAMSON: Sharpness-Aware Minimization Scaled by Outlier Normalization for Improving DNN Generalization and Robustness
Gonçalo Mordido, Sébastien Henwood, Sarath Chandar, François Leduc-Primeau
Native Robustness Sharpness Aware Minimization Neural Network Generalization Deep Neural Network Performance Sharpness Aware Training

November 10, 2022

How Does Sharpness-Aware Minimization Minimize Sharpness?
Kaiyue Wen, Tengyu Ma, Zhiyuan Li
Sharpness Aware Minimization Generalization Guarantee Effective Regularization Sharpness Aware Optimization Gradient Descent Batch Size

November 1, 2022

SADT: Combining Sharpness-Aware Minimization with Self-Distillation for Improved Model Generalization
Masud An-Nur Islam Fahim, Jani Boutellier
Self Distillation Sharpness Aware Minimization Model Generalization Model Generalizability Teacher Student Distillation

October 23, 2022

K-SAM: Sharpness-Aware Minimization at the Speed of SGD
Renkun Ni, Ping-yeh Chiang, Jonas Geiping, Micah Goldblum, Andrew Gordon Wilson, Tom Goldstein
Stochastic Gradient Descent Generalization Performance Natural Gradient Sharpness Aware Minimization Speed Effect Gradient Computation Vanilla Gradient Descent

October 19, 2022

Rethinking Sharpness-Aware Minimization as Variational Inference
Szilvia Ujváry, Zsigmond Telek, Anna Kerekes, Anna Mészáros, Ferenc Huszár
Variational Inference Gradient Based Mean Field Sharpness Aware Minimization Flat Minimum Variational Optimization

October 13, 2022

GA-SAM: Gradient-Strength based Adaptive Sharpness-Aware Minimization for Improved Generalization
Zhiyuan Zhang, Ruixuan Luo, Qi Su, Xu Sun
Adaptive Importance Generalization Performance Natural Gradient Sharpness Aware Minimization Improved Generalization

October 11, 2022

October 4, 2022