the latest in aiBeta

Attack Paradigm

Attack paradigms in machine learning explore vulnerabilities in models, primarily focusing on how adversarial inputs can elicit unexpected or harmful outputs. Current research emphasizes developing both sophisticated attacks, such as those leveraging bijection learning or exploiting internal model flaws to generate targeted responses, and robust defenses, including versatile methods that adapt to diverse attack strategies and those employing reinforcement learning for improved detection. This research is crucial for enhancing the security and reliability of machine learning systems across various applications, from language models to image recognition, by identifying and mitigating vulnerabilities before deployment.

8papers

Papers

March 6, 2025

Energy-Latency Attacks: A New Adversarial Threat to Deep Learning
Latency Attack Attack Strategy Attack Paradigm DNN Framework Deep Learning

February 18, 2025

UniGuardian: A Unified Defense for Detecting Prompt Injection, Backdoor Attacks and Adversarial Attacks in Large Language Models
Malicious Prompt New Attack Attack Paradigm Prompt Injection Attack Prompt Injection Adversarial Attack

January 28, 2025

Data Duplication: A Novel Multi-Purpose Attack Paradigm in Machine Unlearning
Data Deduplication Long Form Novel New Machine Unlearning Model Attack Paradigm Harmful Unlearning Near Duplicate

October 2, 2024

Endless Jailbreaks with Bijection Learning
Attack Paradigm Jailbreak Attack Language Model Adversarial Input

August 27, 2024

Atoxia: Red-teaming Large Language Models with Target Toxic Answers
Attack Paradigm Attack Performance Language Model Black Box Model Adversarial Text

March 13, 2024

Versatile Defense Against Adversarial Attacks on Image Recognition
Adversarial Attack Attack Paradigm Image Recognition

December 13, 2023

Defenses in Adversarial Machine Learning: A Survey
Attack Paradigm Timely Survey State of the Art Defense Adversarial Learning

December 3, 2023

Towards Sample-specific Backdoor Attack with Clean Labels via Attribute Trigger
Attack Paradigm Clean Label Attribute Manipulation Backdoor Attack Backdoor Defense Sample Pair

February 19, 2023

Attacks in Adversarial Machine Learning: A Systematic Survey from the Life-cycle Perspective
Attack Paradigm Adversarial Attack Adversarial Learning Life Cycle Adversarial Influence Comprehensive Survey New Attack

July 25, 2022

Versatile Weight Attack via Flipping Limited Bits
Attack Paradigm Backdoor Poisoning Attack Adversarial Attack Bit Flip

March 13, 2022

LAS-AT: Adversarial Training with Learnable Attack Strategy
Learning Based Attack Adversarial Example Attack Paradigm Adversarial Training Attack Strategy