Diverse Counterfactuals

Diverse counterfactual explanations aim to improve the interpretability and fairness of machine learning models by generating multiple alternative inputs that would change a model's prediction. Current research focuses on developing algorithms to generate these counterfactuals, particularly for text and image data, using techniques like inpainting, subgraph generation, and feature-based learning within various model architectures including graph neural networks and large language models. This work is crucial for addressing biases in models, enhancing user trust through explainability, and improving the robustness and fairness of AI systems across diverse applications.

Papers

June 17, 2024

They're All Doctors: Synthesizing Diverse Counterfactuals to Mitigate Associative Bias
Salma Abdel Magid, Jui-Hsien Wang, Kushal Kafle, Hanspeter Pfister
Vision Language Model Text to Image Model CLIP Model Counterfactual Image Internal Medicine DOCTOR Visual Appearance Biased Association Diverse Counterfactuals

April 23, 2024

Interactive Analysis of LLMs using Meaningful Counterfactuals
Furui Cheng, Vilém Zouhar, Robin Shing Moon Chan, Daniel Fürst, Hendrik Strobelt, Mennatallah El-Assady
Medical LLM Counterfactual Example Counterfactual Method Diverse Counterfactuals Meaningful Counterfactuals

July 18, 2023

Rumor Detection with Diverse Counterfactual Evidence
Kaiwei Zhang, Junchi Yu, Haichao Shi, Jian Liang, Xiao-Yu Zhang
Rumor Detection Diverse Counterfactuals Rumor Detection Model

July 17, 2023

Do Models Explain Themselves? Counterfactual Simulatability of Natural Language Explanations
Yanda Chen, Ruiqi Zhong, Narutatsu Ri, Chen Zhao, He He, Jacob Steinhardt, Zhou Yu, Kathleen McKeown
Full Model Natural Language Explanation Diverse Counterfactuals Counterfactual Simulatability

October 17, 2022

Beyond Model Interpretability: On the Faithfulness and Adversarial Robustness of Contrastive Textual Explanations
Julia El Zini, Mariette Awad
Adversarial Robustness Latent Representation Model Interpretability Contrastive Example Contrastive Method Contrastive Explanation Contrastive Demonstration Diverse Counterfactuals

September 27, 2022

Feature-based Learning for Diverse and Privacy-Preserving Counterfactual Explanations
Vy Vo, Trung Le, Van Nguyen, He Zhao, Edwin Bonilla, Gholamreza Haffari, Dinh Phung
Counterfactual Explanation Feature Learning Diverse Set Counterfactual Data Diverse Counterfactuals

January 17, 2022

Principled Diverse Counterfactuals in Multilinear Models
Ioannis Papantonis, Vaishak Belle
Machine Learning Random Forest Counterfactual Explanation Model Validation Multilinear Mixing Model Diverse Counterfactuals

Diverse Counterfactuals

Papers

They're All Doctors: Synthesizing Diverse Counterfactuals to Mitigate Associative Bias

Interactive Analysis of LLMs using Meaningful Counterfactuals

Rumor Detection with Diverse Counterfactual Evidence

Do Models Explain Themselves? Counterfactual Simulatability of Natural Language Explanations

Beyond Model Interpretability: On the Faithfulness and Adversarial Robustness of Contrastive Textual Explanations

Feature-based Learning for Diverse and Privacy-Preserving Counterfactual Explanations

Principled Diverse Counterfactuals in Multilinear Models