Calibration Attack

Calibration attacks are adversarial attacks designed to manipulate the confidence scores of machine learning models without altering their predictions, thereby undermining the trustworthiness of model outputs. Current research focuses on developing methods to both launch these attacks (e.g., creating under- or over-confident models) and defend against them, often employing adversarial training techniques and analyzing the impact on metrics like expected calibration error. This research is crucial for ensuring the reliability of machine learning systems in high-stakes applications where accurate confidence estimates are essential for safe and effective decision-making.

Papers

July 2, 2024

Attack-Aware Noise Calibration for Differential Privacy
Bogdan Kulynych, Juan Felipe Gomez, Georgios Kaissis, Flavio du Pin Calmon, Carmela Troncoso
Differential Privacy Inference Attack Privacy Budget Calibration Attack

May 22, 2024

Towards Certification of Uncertainty Calibration under Adversarial Attacks
Cornelius Emde, Francesco Pinto, Thomas Lukasiewicz, Philip H. S. Torr, Adel Bibi
Adversarial Attack Adversarial Perturbation Uncertainty Calibration Calibration Error Calibration Attack

February 22, 2024

Uncertainty-driven and Adversarial Calibration Learning for Epicardial Adipose Tissue Segmentation
Kai Zhao, Zhiming Liu, Jiaqi Liu, Jingbiao Zhou, Bihong Liao, Huifang Tang, Qiuyu Wang, Chunquan Li
Level Supervision Cardiac MRI Dataset Epicardial Adipose Tissue Calibration Attack

January 5, 2024

Calibration Attacks: A Comprehensive Study of Adversarial Attacks on Model Confidence
Stephen Obadinma, Xiaodan Zhu, Hongyu Guo
Adversarial Attack Comprehensive Study Model Confidence Calibration Attack

January 15, 2023

Rationalizing Predictions by Adversarial Information Calibration
Lei Sha, Oana-Maria Camburu, Thomas Lukasiewicz
Rationale Extraction Network Selection Subword Regularization Calibration Attack

April 13, 2022

Calibrating Class Weights with Multi-Modal Information for Partial Video Domain Adaptation
Xiyu Wang, Yuecong Xu, Kezhi Mao, Jianfei Yang
Cross Domain Multimodal Information Video Domain Adaptation Class Calibration Class Weight Calibration Attack