Trojan Attack

Trojan attacks involve the malicious insertion of hidden functionalities into machine learning models or hardware circuits, causing unintended behavior triggered by specific inputs. Current research focuses on detecting and mitigating these attacks across various domains, including deep neural networks, large language models, and analog/mixed-signal circuits, employing techniques like large language models (LLMs), adversarial learning, and analysis of attention mechanisms or network sparsity. The significance of this research lies in securing increasingly prevalent AI systems and hardware components, safeguarding against potentially catastrophic consequences in safety-critical applications.

Papers

November 22, 2022

Don't Watch Me: A Spatio-Temporal Trojan Attack on Deep-Reinforcement-Learning-Augment Autonomous Driving
Yinbo Yu, Jiajia Liu
Deep Reinforcement Learning Trojan Attack

November 20, 2022

ESTAS: Effective and Stable Trojan Attacks in Self-supervised Encoders with One Target Unlabelled Sample
Jiaqi Xue, Qian Lou
Self Supervised Learning Self Supervised Supervised Learning External Sample Trojan Attack Target Amazon Ally Diffusion Attack

October 27, 2022

Rethinking the Reverse-engineering of Trojan Triggers
Zhenting Wang, Kai Mei, Hailun Ding, Juan Zhai, Shiqing Ma
Reverse Engineering Trojan Attack Trojan Detection

September 5, 2022

An Adaptive Black-box Defense against Trojan Attacks (TrojDef)
Guanxiong Liu, Abdallah Khreishah, Fatima Sharadgah, Issa Khalil
Back Propagation Trojan Attack Black Box Defense

August 9, 2022

Attention Hijacking in Trojan Transformers
Weimin Lyu, Songzhu Zheng, Tengfei Ma, Haibin Ling, Chao Chen
Attention Pattern Trojan Attack Pay Attention Trojan Detection

August 8, 2022

PerD: Perturbation Sensitivity-based Neural Trojan Detection Framework on NLP Applications
Diego Garcia-soto, Huili Chen, Farinaz Koushanfar
Trojan Attack NLP Application Small Perturbation Trojan Detection Neural Trojan

July 27, 2022

Hardly Perceptible Trojan Attack against Neural Networks with Bit Flips
Jiawang Bai, Kuofeng Gao, Dihong Gong, Shu-Tao Xia, Zhifeng Li, Wei Liu
Neural Network Trojan Attack Attack Performance Bit Flip

July 8, 2022

Defense Against Multi-target Trojan Attacks
Haripriya Harikumar, Santu Rana, Kien Do, Sunil Gupta, Wei Zong, Willy Susilo, Svetha Venkastesh
Adversarial Attack Trojan Attack Trojan Detection

May 26, 2022

BppAttack: Stealthy and Efficient Trojan Attacks against Deep Neural Networks via Image Quantization and Contrastive Adversarial Learning
Zhenting Wang, Juan Zhai, Shiqing Ma
Deep Neural Network Adversarial Attack Trojan Attack Digital STEALTH Metric Image Quantization Adversarial Contrastive

May 24, 2022

Quarantine: Sparsity Can Uncover the Trojan Attack Trigger for Free
Tianlong Chen, Zhenyu Zhang, Yihua Zhang, Shiyu Chang, Sijia Liu, Zhangyang Wang
Sparsity Increase Lottery Ticket Trojan Attack Trojan Detection Neural Trojan Trojan Horse

May 13, 2022

A Study of the Attention Abnormality in Trojaned BERTs
Weimin Lyu, Songzhu Zheng, Tengfei Ma, Chao Chen
Study Feature Trojan Attack Trojan Detection Trojaned Model

February 24, 2022

Towards Effective and Robust Neural Trojan Defenses via Input Filtering
Kien Do, Haripriya Harikumar, Hung Le, Dung Nguyen, Truyen Tran, Santu Rana, Dang Nguyen, Willy Susilo, Svetha Venkatesh
Trojan Attack Neural Trojan

February 23, 2022

Using Deep Learning to Detect Digitally Encoded DNA Trigger for Trojan Malware in Bio-Cyber Attacks
Mohd Siblee Islam, Stepan Ivanov, Hamdan Awan, Jennifer Drohan, Sasitharan Balasubramaniam, Lee Coffey, Srivatsan Kidambi, Witty Sri-saan
Deep Learning Cyber Attack Trojan Attack Protein Sequence Encoder Hybrid Attack

February 15, 2022

A Survey of Neural Trojan Attacks and Defenses in Deep Learning
Jie Wang, Ghulam Mubashar Hassan, Naveed Akhtar
Deep Learning Artificial Intelligence Timely Survey Trojan Attack Neural Trojan

November 29, 2021

Third-Party Hardware IP Assurance against Trojans through Supervised Learning and Post-processing
Pravin Gaikwad, Jonathan Cruz, Prabuddha Chakraborty, Swarup Bhunia, Tamzidul Hoque
Supervised Learning Post Processing Trojan Attack Trojan Detection Hardware Trojan