Poisoned Data

Poisoned data, the malicious injection of corrupted samples into training datasets, poses a significant threat to the reliability and security of machine learning models. Current research focuses on developing robust defenses, including methods that leverage self-supervised learning, filter poisoned samples based on backdoor attack characteristics, and selectively "unlearn" poisoned data from already trained models. These efforts are crucial for ensuring the trustworthiness of machine learning systems across various applications, particularly in sensitive domains like healthcare and autonomous driving, where model robustness is paramount.

Papers

September 13, 2024

Exploiting Supervised Poison Vulnerability to Strengthen Self-Supervised Defense
Jeremy Styborski, Mingzhi Lyu, Yi Huang, Adams Kong
Adversarial Training Availability Attack Poisoned Data Poisoning Efficiency

June 23, 2024

CBPF: Filtering Poisoned Data Based on Composite Backdoor Attack
Hanfeng Xia, Haibo Hong, Ruili Wang
Backdoor Attack Backdoor Poisoning Attack Poisoned Data Composite Attack Target Class

June 13, 2024

Potion: Towards Poison Unlearning
Stefan Schoepf, Jack Foster, Alexandra Brintrup
Adversarial Attack Poisoned Data Poison Detection

May 1, 2024

On the Relevance of Byzantine Robust Optimization Against Data Poisoning
Sadegh Farhadkhani, Rachid Guerraoui, Nirupam Gupta, Rafael Pinot
Relative Relevance Data Poisoning Byzantine Robust Poisoned Data Byzantine Machine Learning

April 17, 2024

The Victim and The Beneficiary: Exploiting a Poisoned Model to Train a Clean Model on Poisoned Data
Zixuan Zhu, Rui Wang, Cong Zou, Lihua Jing
Backdoor Attack Poisoning Attack Poisoned Data Feature Suppression Male Victim Backdoor Threat

April 8, 2024

Best-of-Venom: Attacking RLHF by Injecting Poisoned Preference Data
Tim Baumgärtner, Yang Gao, Dana Alon, Donald Metzler
Reinforcement Learning From Human Feedback Reward Model Training Best of N Poisoned Data Preference Poisoning

February 26, 2024

FedReview: A Review Mechanism for Rejecting Poisoned Updates in Federated Learning
Tianhang Zheng, Baochun Li
Adversarial Environment Poisoned Data Review Mechanism

December 20, 2023

Progressive Poisoned Data Isolation for Training-time Backdoor Defense
Yiming Chen, Haiwei Wu, Jiantao Zhou
Data Poisoning Training Time Attack Social Isolation Poisoned Data Input Level Backdoor Detection

October 10, 2023

Leveraging Diffusion-Based Image Variations for Robust Training on Poisoned Data
Lukas Struppek, Martin B. Hentschel, Clifton Poth, Dominik Hintersdorf, Kristian Kersting
Knowledge Distillation Backdoor Attack Robust Training Backdoor Trigger Poisoned Data Image Variation

January 6, 2023

TrojanPuzzle: Covertly Poisoning Code-Suggestion Models
Hojjat Aghakhani, Wei Dai, Andre Manoel, Xavier Fernandes, Anant Kharkar, Christopher Kruegel, Giovanni Vigna, David Evans, Ben Zorn, Robert Sim
Data Poisoning Attack Poisoned Data

November 3, 2022

Try to Avoid Attacks: A Federated Data Sanitization Defense for Healthcare IoMT Systems
Chong Chen, Ying Gao, Leyu Shi, Siquan Huang
New Attack Data Poisoning Attack Internet of Medical Thing Poisoned Data Malicious Data Federated Data Sanitization Defense

April 29, 2022

Exploration and Exploitation in Federated Learning to Exclude Clients with Poisoned Data
Shadha Tabatabai, Ihab Mohammed, Basheer Qolomany, Abdullatif Albasser, Kashif Ahmad, Mohamed Abdallah, Ala Al-Fuqaha
Machine Learning Environment Exploration Real World eXploitation Client Collaboration Evolutionary Method Poisoned Data

Poisoned Data

Papers

Exploiting Supervised Poison Vulnerability to Strengthen Self-Supervised Defense

CBPF: Filtering Poisoned Data Based on Composite Backdoor Attack

Potion: Towards Poison Unlearning

On the Relevance of Byzantine Robust Optimization Against Data Poisoning

The Victim and The Beneficiary: Exploiting a Poisoned Model to Train a Clean Model on Poisoned Data

Best-of-Venom: Attacking RLHF by Injecting Poisoned Preference Data

FedReview: A Review Mechanism for Rejecting Poisoned Updates in Federated Learning

Progressive Poisoned Data Isolation for Training-time Backdoor Defense

Leveraging Diffusion-Based Image Variations for Robust Training on Poisoned Data

TrojanPuzzle: Covertly Poisoning Code-Suggestion Models

Try to Avoid Attacks: A Federated Data Sanitization Defense for Healthcare IoMT Systems

Exploration and Exploitation in Federated Learning to Exclude Clients with Poisoned Data