Harmful Unlearning

May 24, 2024

Unlearning during Learning: An Efficient Federated Machine Unlearning Method
Hanlin Gu, Gongxi Zhu, Jie Zhang, Xinyuan Zhao, Yuxing Han, Lixin Fan, Qiang Yang
LeArning Abstract Harmful Unlearning Federated Unlearning Machine Learning Paradigm
Defensive Unlearning with Adversarial Training for Robust Concept Erasure in Diffusion Models
Yimeng Zhang, Xin Chen, Jinghan Jia, Yihua Zhang, Chongyu Fan, Jiancheng Liu, Mingyi Hong, Ke Ding, Sijia Liu
Diffusion Model Adversarial Training Unlearning Framework Harmful Unlearning Robust Unlearning
Machine Unlearning in Large Language Models
Saaketh Koundinya Gundavarapu, Shreya Agarwal, Arushi Arora, Chandana Thimmalapura Jagadeeshaiah
Large Language Model Machine Unlearning Harmful Unlearning Knowledge Unlearning

May 23, 2024

Unified Neural Backdoor Removal with Only Few Clean Samples through Unlearning and Relearning
Nay Myat Min, Long H. Pham, Jun Sun
Backdoor Attack Harmful Unlearning Backdoor Removal Neural Backdoor

May 16, 2024

Data Selection for Transfer Unlearning
Nazanin Mohammadi Sepahvand, Vincent Dumoulin, Eleni Triantafillou, Gintare Karolina Dziugaite
Unlearning Framework Harmful Unlearning Data Selection

May 12, 2024

Machine Unlearning in Contrastive Learning
Zixin Wang, Kongyang Chen
Contrastive Learning Self Supervised Learning Supervised Learning Machine Unlearning Harmful Unlearning

April 19, 2024

Is Retain Set All You Need in Machine Unlearning? Restoring Performance of Unlearned Models with Out-Of-Distribution Images
Jacopo Bonato, Marco Cotogni, Luigi Sabetta
System Performance Machine Unlearning Unlearning Framework Harmful Unlearning Unlearned Model Distribution Image Approximate Unlearning Unlearning Model

April 2, 2024

Efficient and Generalizable Certified Unlearning: A Hessian-free Recollection Approach
Xinbao Qiao, Meng Zhang, Ming Tang, Ermin Wei
High Efficiency High Dimensional Unlearning Framework Harmful Unlearning Unlearned Model Hessian Free

April 1, 2024

Machine Unlearning for Traditional Models and Large Language Models: A Short Survey
Yi Xu
Machine Learning Anti Forgetting Machine Unlearning Harmful Unlearning

March 31, 2024

Label-Agnostic Forgetting: A Supervision-Free Unlearning in Deep Models
Shaofei Shen, Chenhao Zhang, Yawen Zhao, Alina Bialkowski, Weitong Tony Chen, Miao Xu
Anti Forgetting Deep Model Machine Unlearning Unlearning Framework Harmful Unlearning

March 21, 2024

$\nabla \tau$: Gradient-based and Task-Agnostic machine Unlearning
Daniel Trippa, Cesare Campagnano, Maria Sofia Bucarelli, Gabriele Tolomei, Fabrizio Silvestri
Machine Unlearning Unlearning Framework Harmful Unlearning Unlearning Method

March 19, 2024

Towards Lifecycle Unlearning Commitment Management: Measuring Sample-level Approximate Unlearning Completeness
Cheng-Long Wang, Qi Li, Zihang Xiang, Yinzhi Cao, Di Wang
Unlearning Framework Harmful Unlearning Knowledge Unlearning Approximate Unlearning

March 5, 2024

March 4, 2024

SoK: Challenges and Opportunities in Federated Unlearning
Hyejun Jeong, Shiqing Ma, Amir Houmansadr
Technical Challenge Emerging Opportunity Harmful Unlearning Unlearning Method Federated Unlearning

February 26, 2024

Eight Methods to Evaluate Robust Unlearning in LLMs
Aengus Lynch, Phillip Guo, Aidan Ewart, Stephen Casper, Dylan Hadfield-Menell
Large Language Model Medical LLM NCD Method Machine Unlearning Harmful Unlearning Robust Unlearning Unlearning Evaluation

February 19, 2024

UnlearnCanvas: Stylized Image Dataset for Enhanced Machine Unlearning Evaluation in Diffusion Models
Yihua Zhang, Chongyu Fan, Yimeng Zhang, Yuguang Yao, Jinghan Jia, Jiancheng Liu, Gaoyuan Zhang, Gaowen Liu, Ramana Rao Kompella, Xiaoming Liu, Sijia Liu
Diffusion Model Unlearning Framework Harmful Unlearning Unlearning Evaluation

February 14, 2024

Soft Prompt Threats: Attacking Safety Alignment and Unlearning in Open-Source LLMs through the Embedding Space
Leo Schwinn, David Dobre, Sophie Xhonneux, Gauthier Gidel, Stephan Gunnemann
Adversarial Robustness Deep Space Harmful Unlearning LLM Generated Open Source LLM Threat Model Safety Alignment Soft Prompt Closed Source Model Language Space

February 2, 2024

Papers

Unlearning during Learning: An Efficient Federated Machine Unlearning Method

Defensive Unlearning with Adversarial Training for Robust Concept Erasure in Diffusion Models

Machine Unlearning in Large Language Models

Unified Neural Backdoor Removal with Only Few Clean Samples through Unlearning and Relearning

Data Selection for Transfer Unlearning

Machine Unlearning in Contrastive Learning

Is Retain Set All You Need in Machine Unlearning? Restoring Performance of Unlearned Models with Out-Of-Distribution Images

Efficient and Generalizable Certified Unlearning: A Hessian-free Recollection Approach

Machine Unlearning for Traditional Models and Large Language Models: A Short Survey

Label-Agnostic Forgetting: A Supervision-Free Unlearning in Deep Models

$\nabla \tau$: Gradient-based and Task-Agnostic machine Unlearning

Towards Lifecycle Unlearning Commitment Management: Measuring Sample-level Approximate Unlearning Completeness

Guardrail Baselines for Unlearning in LLMs

The WMDP Benchmark: Measuring and Reducing Malicious Use With Unlearning

SoK: Challenges and Opportunities in Federated Unlearning

Eight Methods to Evaluate Robust Unlearning in LLMs

UnlearnCanvas: Stylized Image Dataset for Enhanced Machine Unlearning Evaluation in Diffusion Models

Soft Prompt Threats: Attacking Safety Alignment and Unlearning in Open-Source LLMs through the Embedding Space

An Information Theoretic Approach to Machine Unlearning

Federated Unlearning: a Perspective of Stability and Fairness