Consistent Counterfactuals

Consistent counterfactuals are synthetic data points minimally altered from existing data to change a model's prediction, offering insights into model behavior and improving fairness and robustness. Research focuses on generating these counterfactuals across various data types (text, graphs, images) using diverse methods, including generative adversarial networks (GANs), diffusion models, and transformer networks, often incorporating constraints to ensure realism and interpretability. This work is significant for enhancing model explainability, mitigating bias, and improving the reliability of machine learning predictions across domains like healthcare and automated essay scoring.

Papers

July 18, 2024

Motif-Consistent Counterfactuals with Adversarial Refinement for Graph-Level Anomaly Detection
Chunjing Xiao, Shikang Pang, Wenxin Tai, Yanlong Huang, Goce Trajcevski, Fan Zhou
Refinement Network Graph Level Anomaly Detection Counterfactual Graph Consistent Counterfactuals

July 4, 2024

A Survey on Natural Language Counterfactual Generation
Yongjie Wang, Xiaoqi Qiu, Yu Yue, Xu Guo, Zhiwei Zeng, Yuhong Feng, Zhiqi Shen
Timely Survey High Quality Counterfactuals Counterfactual Generation Consistent Counterfactuals Counterfactual Generation Method

June 8, 2024

Attri-Net: A Globally and Locally Inherently Interpretable Model for Multi-Label Classification Using Class-Specific Counterfactuals
Susu Sun, Stefano Woerner, Andreas Maier, Lisa M. Koch, Christian F. Baumgartner
Inherent Interpretability Multi Label Classification Interpretable Model Global Explanation Attribution Map Consistent Counterfactuals Local Interpretable

May 29, 2024

December 21, 2023

Fast Diffusion-Based Counterfactuals for Shortcut Removal and Generation
Nina Weng, Paraskevas Pegios, Aasa Feragen, Eike Petersen, Siavash Bigdeli
Faithful Generation Counterfactual Explanation Shortcut Learning Counterfactual Image Shortcut Pattern Avoidance Loss Consistent Counterfactuals

March 1, 2023

Inherently Interpretable Multi-Label Classification Using Class-Specific Counterfactuals
Susu Sun, Stefano Woerner, Andreas Maier, Lisa M. Koch, Christian F. Baumgartner
Inherent Interpretability Interpretable Model Interpretable Classifier Attribution Map Consistent Counterfactuals

July 15, 2022

Outcome-Guided Counterfactuals for Reinforcement Learning Agents from a Jointly Trained Generative Latent Space
Eric Yeh, Pedro Sequeira, Jesse Hostetler, Melinda Gervasio
Reinforcement Learning Latent Space Variational Autoencoder Reinforcement Learning Agent Counterfactual Example Consistent Counterfactuals Latent Space Interpolation

July 14, 2022

A Query-Optimal Algorithm for Finding Counterfactuals
Guy Blanc, Caleb Koch, Jane Lange, Li-Yang Tan
High Quality Counterfactuals Theoretical Guarantee Query Complexity Monotone Function Consistent Counterfactuals

July 9, 2022

SCouT: Synthetic Counterfactuals via Spatiotemporal Transformers for Actionable Healthcare
Bhishma Dedhia, Roshini Balasubramanian, Niraj K. Jha
Synthetic Data Spatiotemporal Transformer Actionable Part Synthetic Control Counterfactual World Consistent Counterfactuals SCouT Net Counterfactual Sequence

March 28, 2022

Cycle-Consistent Counterfactuals by Latent Transformations
Saeed Khorram, Li Fuxin
Generative Network Consistent Counterfactuals Counterfactual Representation

November 29, 2021

Equitable modelling of brain imaging by counterfactual augmentation with morphologically constrained 3D deep generative models
Guilherme Pombo, Robert Gray, Jorge Cardoso, Sebastien Ourselin, Geraint Rees, John Ashburner, Parashkev Nachev
Conditional Generative 3D Generative Fair Model Consistent Counterfactuals Counterfactual Augmentation

Consistent Counterfactuals

Papers

Motif-Consistent Counterfactuals with Adversarial Refinement for Graph-Level Anomaly Detection

A Survey on Natural Language Counterfactual Generation

Attri-Net: A Globally and Locally Inherently Interpretable Model for Multi-Label Classification Using Class-Specific Counterfactuals

Beyond Agreement: Diagnosing the Rationale Alignment of Automated Essay Scoring Methods based on Linguistically-informed Counterfactuals

Counterfactual Metarules for Local and Global Recourse

Fast Diffusion-Based Counterfactuals for Shortcut Removal and Generation

Inherently Interpretable Multi-Label Classification Using Class-Specific Counterfactuals

Outcome-Guided Counterfactuals for Reinforcement Learning Agents from a Jointly Trained Generative Latent Space

A Query-Optimal Algorithm for Finding Counterfactuals

SCouT: Synthetic Counterfactuals via Spatiotemporal Transformers for Actionable Healthcare

Cycle-Consistent Counterfactuals by Latent Transformations

Equitable modelling of brain imaging by counterfactual augmentation with morphologically constrained 3D deep generative models