Flip Attack

Flip attacks exploit the vulnerability of machine learning models to minor data manipulations, aiming to degrade their performance or inject malicious behavior. Current research focuses on developing efficient flip attacks targeting various model architectures, including large language models (LLMs), graph neural networks (GNNs), and deep neural networks (DNNs), often employing techniques like bit flipping or label alteration. These attacks highlight critical security risks in deploying machine learning systems, particularly in safety-critical applications, and drive the development of robust defenses against data manipulation.

Papers

October 2, 2024

FlipAttack: Jailbreak LLMs via Flipping
Yue Liu, Xiaoxin He, Miao Xiong, Jinlan Fu, Shumin Deng, Bryan Hooi
Jailbreak Attack Attack Success Rate Motor Augmented Mode Black Box LLM Negative Flip Flip Attack

November 2, 2023

Attacking Graph Neural Networks with Bit Flips: Weisfeiler and Lehman Go Indifferent
Lorenz Kummer, Samir Moustafa, Nils N. Kriege, Wilfried N. Gansterer
Graph Neural Network Weisfeiler Leman Bit Flip Attack Bit Flip Flip Attack Fault Injection Attack

August 12, 2023

One-bit Flip is All You Need: When Bit-flip Attack Meets Model Training
Jianshuo Dong, Han Qiu, Yiming Li, Tianwei Zhang, Yuanjie Li, Zeqi Lai, Chao Zhang, Shu-Tao Xia
Model Training Malicious Model Bit Flip Attack Bit Flip Flip Attack Bit Training

August 17, 2022

Label Flipping Data Poisoning Attack Against Wearable Human Activity Recognition System
Abdur R. Shahid, Ahmed Imteaj, Peter Y. Wu, Diane A. Igoche, Tauhidul Alam
Activity Recognition Data Poisoning Attack Label Poisoning Attack Flip Attack Label Poisoning

April 12, 2022

Breaking Fair Binary Classification with Optimal Flipping Attacks
Changhun Jo, Jy-yong Sohn, Kangwook Lee
Fairness Constraint Fair Machine Learning FAir Classifier Flip Attack

January 22, 2022

Parallel Rectangle Flip Attack: A Query-based Black-box Attack against Object Detection
Siyuan Liang, Baoyuan Wu, Yanbo Fan, Xingxing Wei, Xiaochun Cao
Bounding Box White Box Black Box Attack Flip Attack

December 7, 2021

BDFA: A Blind Data Adversarial Bit-flip Attack on Deep Neural Networks
Behnam Ghavami, Mani Sadati, Mohammad Shahidzadeh, Zhenman Fang, Lesley Shannon
Deep Neural Network Feedback Alignment Accuracy Loss Bit Flip Attack Bit Flip Flip Attack