Poison Detection

Poisoning attacks, where malicious actors contaminate training data to compromise machine learning models, are a significant threat to AI security. Current research focuses on developing robust detection and mitigation techniques, exploring methods like outlier detection, hyperparameter optimization for unlearning poisoned data, and proactive approaches that leverage the inherent characteristics of poisoned models to improve detection. These efforts are crucial for ensuring the reliability and trustworthiness of machine learning systems across various applications, from image recognition to federated learning, and are driving advancements in model robustness and security.

Papers

June 13, 2024

Potion: Towards Poison Unlearning
Stefan Schoepf, Jack Foster, Alexandra Brintrup
Adversarial Attack Poisoned Data Poison Detection

February 19, 2024

Defending Against Weight-Poisoning Backdoor Attacks for Parameter-Efficient Fine-Tuning
Shuai Zhao, Leilei Gan, Luu Anh Tuan, Jie Fu, Lingjuan Lyu, Meihuizi Jia, Jinming Wen
Backdoor Attack Parameter Efficient Fine Tuning Backdoor Poisoning Attack Robust Defense Poison Detection

January 5, 2023

Silent Killer: A Stealthy, Clean-Label, Black-Box Backdoor Attack
Tzvi Lederer, Gallil Maimon, Lior Rokach
Backdoor Poisoning Attack Clean Label Attack Label Poisoning Poison Detection

September 30, 2022

Blockchain-based Monitoring for Poison Attack Detection in Decentralized Federated Learning
Ranwa Al Mallah, David Lopez
Federated Learning Decentralized Federated Learning Copyright Traceability Poison Detection

May 26, 2022

Towards A Proactive ML Approach for Detecting Backdoor Poison Samples
Xiangyu Qi, Tinghao Xie, Jiachen T. Wang, Tong Wu, Saeed Mahloujifar, Prateek Mittal
Backdoor Attack Machine Learning Approach Backdoor Sample Poison Detection

April 19, 2022

Poisons that are learned faster are more effective
Pedro Sandoval-Segura, Vasu Singla, Liam Fowl, Jonas Geiping, Micah Goldblum, David Jacobs, Tom Goldstein
Poisoning Attack Transferable Adversarial Attack Poisoning Efficiency Poison Detection