Defense Model

Defense models for machine learning systems aim to protect against various attacks, including adversarial examples, data poisoning, and model stealing. Current research focuses on developing robust defenses using techniques like reinforcement learning, information-theoretic approaches, and adversarial training, often incorporating deep neural networks. The effectiveness of these defenses is critically evaluated, with a growing emphasis on rigorous testing and identifying vulnerabilities to ensure reliable performance in high-stakes applications such as national security and healthcare. This field is crucial for building trustworthy AI systems capable of withstanding malicious manipulation.

Papers

November 18, 2024

Llama Guard 3-1B-INT4: Compact and Efficient Safeguard for Human-AI Conversations
Igor Fedorov, Kate Plawiak, Lemeng Wu, Tarek Elgamal, Naveen Suda, Eric Smith, Hongyuan Zhan, Jianfeng Chi, Yuriy Hulovatyy, Kimish Patel, Zechun Liu, Changsheng Zhao, Yangyang Shi, Tijmen Blankevoort, Mahesh Pasupuleti, Bilge Soran, Zacharie Delpierre Coudert, Rachad Alao, Raghuraman Krishnamoorthi, Vikas Chandra
Community Conversation Resource Constrained Device Embracing CompAct Whispering Llama DEfense Mechanism Defense Model Fine Tuned Llama

October 1, 2024

ROK Defense M&S in the Age of Hyperscale AI: Concepts, Challenges, and Future Directions
Youngjoon Lee, Taehyun Park, Yeongjoon Kang, Jonghoe Kim, Joonhyuk Kang
Artificial Intelligence Technical Challenge Future Direction Concept Identification Defense Model

February 24, 2024

Optimal Zero-Shot Detector for Multi-Armed Attacks
Federica Granese, Marco Romanelli, Pablo Piantanida
Adversarial Attack Malicious Agent Shi Detector Defense Model

February 12, 2024

Understanding Deep Learning defenses Against Adversarial Examples Through Visualizations for Dynamic Risk Assessment
Xabier Echeberria-Barrio, Amaia Gil-Lerchundi, Jon Egana-Zubia, Raul Orduna-Urrutia
Deep Learning Adversarial Example Adversarial Training Relevant Visualization Defense Model Dynamic Risk Assessment

August 2, 2023

Isolation and Induction: Training Robust Deep Neural Networks against Model Stealing Attacks
Jun Guo, Aishan Liu, Xingyu Zheng, Siyuan Liang, Yisong Xiao, Yichao Wu, Xianglong Liu
Robust Deep Inference Time Model Stealing Attack Social Isolation Automatic Induction Defense Model

June 15, 2023

Inroads into Autonomous Network Defence using Explained Reinforcement Learning
Myles Foley, Mia Wang, Zoe M, Chris Hicks, Vasilios Mavroudis
Reinforcement Learning Adversarial Behavior Attack Strategy Defense Model Cyber Resilience Autonomous Network

May 23, 2022

Multiple Domain Cyberspace Attack and Defense Game Based on Reward Randomization Reinforcement Learning
Lei Zhang, Yu Pan, Yi Liu, Qibin Zheng, Zhisong Pan
Reinforcement Learning Multi Domain Defense Model Multiple Domain

May 4, 2022

Rethinking Classifier and Adversarial Attack
Youhuan Yang, Lei Sun, Leyu Dai, Song Guo, Xiuqing Mao, Xiaoqin Wang, Bayi Xu
Adversarial Attack Adversarial Robustness Defense Model Classifier Re Training

April 3, 2022

Breaking the De-Pois Poisoning Defense
Alaa Anani, Mohamed Ghanem, Lotfy Abdel Khaliq
Black Box Attack Defense Model Model Level Defense

February 18, 2022

Critical Checkpoints for Evaluating Defence Models Against Adversarial Attack and Robustness
Kanak Tekwani, Manojkumar Parmar
Adversarial Attack Native Robustness Machine Learning Model Intermediate Checkpoint Defense Model

Defense Model

Papers

Llama Guard 3-1B-INT4: Compact and Efficient Safeguard for Human-AI Conversations

ROK Defense M&S in the Age of Hyperscale AI: Concepts, Challenges, and Future Directions

Optimal Zero-Shot Detector for Multi-Armed Attacks

Understanding Deep Learning defenses Against Adversarial Examples Through Visualizations for Dynamic Risk Assessment

Isolation and Induction: Training Robust Deep Neural Networks against Model Stealing Attacks

Inroads into Autonomous Network Defence using Explained Reinforcement Learning

Multiple Domain Cyberspace Attack and Defense Game Based on Reward Randomization Reinforcement Learning

Rethinking Classifier and Adversarial Attack

Breaking the De-Pois Poisoning Defense

Critical Checkpoints for Evaluating Defence Models Against Adversarial Attack and Robustness