Adversarial Training

Adversarial training aims to enhance the robustness of machine learning models, particularly deep neural networks, against adversarial attacks—malicious inputs designed to cause misclassification. Current research focuses on improving the efficiency and effectiveness of adversarial training methods, exploring techniques like vector quantization for input transformation, null-space projection for gradient optimization, and module-wise adaptive training for end-to-end systems, as well as applying these techniques to various model architectures including LLMs and Vision Transformers. This field is crucial for ensuring the reliability and security of AI systems in real-world applications, particularly in safety-critical domains where model robustness is paramount.

Papers

November 23, 2024

Steering Away from Harm: An Adaptive Approach to Defending Vision Language Model Against Jailbreaks
Han Wang, Gang Wang, Huan Zhang
Language Model Adversarial Attack Adversarial Training Vision Paper Jailbreak Attack Adversarial Image Adversarial Input Potential Harm Adaptive Approach Adversarial Direction

November 21, 2024

November 13, 2024

Zero-shot Cross-lingual Transfer Learning with Multiple Source and Target Languages for Information Extraction: Language Selection and Adversarial Training
Nghia Trung Ngo, Thien Huu Nguyen
Adversarial Training Information Extraction Unknown Language Multilingual Data Target Language

November 12, 2024

Chain Association-based Attacking and Shielding Natural Language Processing Systems
Jiacheng Huang, Long Chen
Adversarial Attack Adversarial Example Adversarial Training Natural Language Side Chain

November 11, 2024

A Text Classification Model Combining Adversarial Training with Pre-trained Language Model and neural networks: A Case Study on Telecom Fraud Incident Texts
Liu Zhuoxian, Shi Tuo, Hu Xiaofeng
Language Model Neural Network Adversarial Training Fraud Detection Text Classification Model Incident Report Language Model Pre Training

November 8, 2024

A method based on Generative Adversarial Networks for disentangling physical and chemical properties of stars in astronomical spectra
Raúl Santoveña, Carlos Dafonte, Minia Manteiga
Deep Learning Generative Adversarial Network Adversarial Training Latent Space Practical Method Chemical Data Star Model Stellar Spectrum

November 7, 2024

Adversarial Robustness of In-Context Learning in Transformers for Linear Regression
Usman Anwar, Johannes Von Oswald, Louis Kirsch, David Krueger, Spencer Frei
Transformer Megatron Decepticons Context Learning Adversarial Training Adversarial Robustness Novel Regression Layer Transformer Linear Ordered Data Transformer Based Generative Adversarial Gradient Based Adversarial

November 5, 2024

Enhancing Adversarial Robustness via Uncertainty-Aware Distributional Adversarial Training
Junhao Dong, Xinghua Qu, Z. Jane Wang, Yew-Soon Ong
Adversarial Example Adversarial Training Adversarial Robustness Domain Adversarial

October 30, 2024

FAIR-TAT: Improving Model Fairness Using Targeted Adversarial Training
Tejaswini Medi, Steffen Jung, Margret Keuper
Adversarial Attack Adversarial Training Adversarial Robustness Model Fairness Fair Adversarial

October 29, 2024

October 28, 2024

Simultaneous Unlearning of Multiple Protected User Attributes From Variational Autoencoder Recommenders Using Adversarial Training
Gustavo Escobedo, Christian Ganhör, Stefan Brandl, Mirjam Augstein, Markus Schedl
Adversarial Training Supervised Autoencoder Sensitive Attribute Latent Embeddings User Embeddings Variational AutoEncoder Neural Collaborative Filtering

October 25, 2024

Privacy without Noisy Gradients: Slicing Mechanism for Generative Model Training
Kristjan Greenewald, Yuancheng Yu, Hao Wang, Kai Xu
Generative Model Training Data Differential Privacy Adversarial Training Generative Modeling Privacy Policy Functional Mechanism Noisy Gradient

October 21, 2024

October 19, 2024

Adversarial Training: A Survey
Mengnan Zhao, Lihe Zhang, Jingwen Ye, Huchuan Lu, Baocai Yin, Xinchao Wang
Timely Survey Native Robustness Adversarial Example Adversarial Training

October 18, 2024

A Hybrid Defense Strategy for Boosting Adversarial Robustness in Vision-Language Models
Yuhan Liang, Yijun Li, Yumeng Niu, Qianhe Shen, Hangyu Liu
Adversarial Attack Vision Language Model Adversarial Example Adversarial Training Adversarial Robustness CLIP Model

October 16, 2024

Efficient Optimization Algorithms for Linear Adversarial Training
Antônio H. RIbeiro, Thomas B. Schön, Dave Zahariah, Francis Bach
Adversarial Training Gradient Descent Convex Optimization Optimization Algorithm Ridge Regression

Adversarial Training

Papers

Steering Away from Harm: An Adaptive Approach to Defending Vision Language Model Against Jailbreaks

Learning Fair Robustness via Domain Mixup

Multimodal 3D Brain Tumor Segmentation with Adversarial Training and Conditional Random Field

Zero-shot Cross-lingual Transfer Learning with Multiple Source and Target Languages for Information Extraction: Language Selection and Adversarial Training

Chain Association-based Attacking and Shielding Natural Language Processing Systems

A Text Classification Model Combining Adversarial Training with Pre-trained Language Model and neural networks: A Case Study on Telecom Fraud Incident Texts

A method based on Generative Adversarial Networks for disentangling physical and chemical properties of stars in astronomical spectra

Adversarial Robustness of In-Context Learning in Transformers for Linear Regression

Enhancing Adversarial Robustness via Uncertainty-Aware Distributional Adversarial Training

FAIR-TAT: Improving Model Fairness Using Targeted Adversarial Training

Power side-channel leakage localization through adversarial training of deep neural networks

On the Robustness of Adversarial Training Against Uncertainty Attacks

Simultaneous Unlearning of Multiple Protected User Attributes From Variational Autoencoder Recommenders Using Adversarial Training

Privacy without Noisy Gradients: Slicing Mechanism for Generative Model Training

Conflict-Aware Adversarial Training

On the Geometry of Regularization in Adversarial Training: High-Dimensional Asymptotics and Generalization Bounds

LiOn-XA: Unsupervised Domain Adaptation via LiDAR-Only Cross-Modal Adversarial Training

Adversarial Training: A Survey

A Hybrid Defense Strategy for Boosting Adversarial Robustness in Vision-Language Models

Efficient Optimization Algorithms for Linear Adversarial Training