Gradient Surgery

Gradient surgery is a deep learning optimization technique that improves model training by carefully manipulating gradients from multiple loss functions. Current research focuses on applying gradient surgery to diverse problems, including enhancing the robustness of large language models against adversarial attacks, improving the generalization capabilities of medical image segmentation models, and optimizing generative models for one-shot unlearning. This approach offers a powerful way to balance competing objectives during training, leading to improved model performance and efficiency across various applications, particularly in areas like natural language processing, computer vision, and medical image analysis.

Papers

March 1, 2024

Gradient Cuff: Detecting Jailbreak Attacks on Large Language Models by Exploring Refusal Loss Landscapes
Xiaomeng Hu, Pin-Yu Chen, Tsung-Yi Ho
Jailbreak Attack Gradient Surgery

February 23, 2024

GS-EMA: Integrating Gradient Surgery Exponential Moving Average with Boundary-Aware Contrastive Learning for Enhanced Domain Generalization in Aneurysm Segmentation
Fengming Lin, Yan Xia, Michael MacRaild, Yash Deo, Haoran Dou, Qiongyao Liu, Nina Cheng, Nishant Ravikumar, Alejandro F. Frangi
Domain Generalization Domain Invariant Feature Cerebrovascular Segmentation Semi Supervised Domain Generalization Boundary Aware Contrastive Learning Gradient Surgery

February 5, 2024

Careful with that Scalpel: Improving Gradient Surgery with an EMA
Yu-Guan Hsieh, James Thornton, Eugene Ndiaye, Michal Klein, Marco Cuturi, Pierre Ablin
Auxiliary Loss Surgical Instrument Loss Gradient Gradient Surgery

July 10, 2023

Gradient Surgery for One-shot Unlearning on Generative Model
Seohui Bae, Seoyoon Kim, Hyemin Jung, Woohyung Lim
Pre Trained Model Multi Task Learning Generative Modeling Deep Generative Model Data Influence Gradient Surgery

June 26, 2023

GSMorph: Gradient Surgery for cine-MRI Cardiac Deformable Registration
Haoran Dou, Ning Bi, Luyi Han, Yuhao Huang, Ritse Mann, Xin Yang, Dong Ni, Nishant Ravikumar, Alejandro F. Frangi, Yunzhi Huang
Image Registration Deformable Registration Deep Registration Gradient Surgery

January 27, 2022

Dissecting the impact of different loss functions with gradient surgery
Hong Xuan, Robert Pless
Loss Function Global Impact Metric Learning Gradient Update Pairwise Loss Gradient Surgery