Plausible Explanation

Plausible explanation in AI focuses on generating understandable and trustworthy justifications for model predictions, aiming to bridge the gap between complex algorithms and human comprehension. Current research emphasizes diverse explanation methods, including counterfactual examples, feature attributions (often aggregated using optimization techniques), and natural language explanations generated via large language models (LLMs) or other architectures like variational autoencoders. This field is crucial for building trust in AI systems, particularly in high-stakes domains like medicine, and for improving model transparency and accountability by identifying and mitigating biases or spurious correlations.

Papers

May 24, 2023

Abductive Commonsense Reasoning Exploiting Mutually Exclusive Explanations
Wenting Zhao, Justin T. Chiu, Claire Cardie, Alexander M. Rush
Commonsense Reasoning Abductive Reasoning Plausible Explanation

March 30, 2023

Why is plausibility surprisingly problematic as an XAI criterion?
Weina Jin, Xiaoxiao Li, Ghassan Hamarneh
XAI Method Plausible Explanation Explanation Plausibility Human AI Complementarity

March 8, 2023

Interpretable Visual Question Answering Referring to Outside Knowledge
He Zhu, Ren Togo, Takahiro Ogawa, Miki Haseyama
Line by Line Explanation Visual Question Multimodal Input External Knowledge Plausible Explanation Text VQA

December 22, 2022

Impossibility Theorems for Feature Attribution
Blair Bilodeau, Natasha Jaques, Pang Wei Koh, Been Kim
Feature Attribution Interpretability Method Feature Attribution Method Plausible Explanation Model Class Impossibility Theorem

December 18, 2022

LaSQuE: Improved Zero-Shot Classification from Explanations Through Quantifier Modeling and Curriculum Learning
Sayan Ghosh, Rakesh R Menon, Shashank Srivastava
Line by Line Explanation Curriculum Learning Natural Language Explanation Plausible Explanation Language Supervision Existential Quantifier

November 25, 2022

Complementary Explanations for Effective In-Context Learning
Xi Ye, Srinivasan Iyer, Asli Celikyilmaz, Ves Stoyanov, Greg Durrett, Ramakanth Pasunuru
Large Language Model Context Learning Line by Line Explanation Plausible Explanation Explanation Representation Format

November 14, 2022

Explainer Divergence Scores (EDS): Some Post-Hoc Explanations May be Effective for Detecting Unknown Spurious Correlations
Shea Cardozo, Gabriel Islas Montero, Dmitry Kazhdan, Botty Dimanov, Maleakhi Wijaya, Mateja Jamnik, Pietro Lio
Deep Neural Network Spurious Correlation Post Hoc Explanation Plausible Explanation

October 12, 2022

FASTER-CE: Fast, Sparse, Transparent, and Robust Counterfactual Explanations
Shubham Sharma, Alan H. Gee, Jette Henderson, Joydeep Ghosh
Counterfactual Explanation Many Sparse Transparency Index High Quality Counterfactuals Plausible Explanation Faster Pace

September 2, 2022

INTERACTION: A Generative XAI Framework for Natural Language Inference Explanations
Jialin Yu, Alexandra I. Cristea, Anoushka Harit, Zhongtian Sun, Olanrewaju Tahir Aduragba, Lei Shi, Noura Al Moubayed
High Explainability Natural Language Inference Interaction Generation Explanation Generation Plausible Explanation XAI Model Evidence Generation

August 12, 2022

Comparing Baseline Shapley and Integrated Gradients for Local Explanation: Some Additional Insights
Tianshu Feng, Zhipu Zhou, Joshi Tarun, Vijayan N. Nair
Neural Network DCU Insight AQ Shapley Value Local Explanation Plausible Explanation Integrated Gradient

August 5, 2022

Motivating explanations in Bayesian networks using MAP-independence
Johan Kwisthout
Scientific Inference Bayesian Network Plausible Explanation Convincing Explanation Evidence Theory

July 17, 2022

Model-Agnostic and Diverse Explanations for Streaming Rumour Graphs
Thanh Tam Nguyen, Thanh Cong Phan, Minh Hieu Nguyen, Matthias Weidlich, Hongzhi Yin, Jun Jo, Quoc Viet Hung Nguyen
Plausible Explanation Rumour Detection Diverse Graph Annotated Graph Various Rumour Propagation Behaviour

July 4, 2022

June 15, 2022

"Why Here and Not There?" -- Diverse Contrasting Explanations of Dimensionality Reduction
André Artelt, Alexander Schulz, Barbara Hammer
Dimensionality Reduction Data Mining Plausible Explanation

June 9, 2022

Early Transferability of Adversarial Examples in Deep Neural Networks
Oriel BenShmuel
Deep Neural Network Adversarial Example Adversarial Perturbation Task Transferability Plausible Explanation Random Weight Adversarial Planning

May 11, 2022

Keep Your Friends Close and Your Counterfactuals Closer: Improved Learning From Closest Rather Than Plausible Counterfactual Explanations in an Abstract Setting
Ulrike Kuhl, André Artelt, Barbara Hammer
Counterfactual Explanation High Quality Counterfactuals Plausible Explanation Enhanced Learning Writer Independent Setting

Plausible Explanation

Papers

Abductive Commonsense Reasoning Exploiting Mutually Exclusive Explanations

Why is plausibility surprisingly problematic as an XAI criterion?

Interpretable Visual Question Answering Referring to Outside Knowledge

Impossibility Theorems for Feature Attribution

LaSQuE: Improved Zero-Shot Classification from Explanations Through Quantifier Modeling and Curriculum Learning

Complementary Explanations for Effective In-Context Learning

Explainer Divergence Scores (EDS): Some Post-Hoc Explanations May be Effective for Detecting Unknown Spurious Correlations

FASTER-CE: Fast, Sparse, Transparent, and Robust Counterfactual Explanations

INTERACTION: A Generative XAI Framework for Natural Language Inference Explanations

Comparing Baseline Shapley and Integrated Gradients for Local Explanation: Some Additional Insights

Motivating explanations in Bayesian networks using MAP-independence

Model-Agnostic and Diverse Explanations for Streaming Rumour Graphs

Fidelity of Ensemble Aggregation for Saliency Map Explanations using Bayesian Optimization Techniques

Comparing Feature Importance and Rule Extraction for Interpretability on Text Data

"Why Here and Not There?" -- Diverse Contrasting Explanations of Dimensionality Reduction

Early Transferability of Adversarial Examples in Deep Neural Networks

Keep Your Friends Close and Your Counterfactuals Closer: Improved Learning From Closest Rather Than Plausible Counterfactual Explanations in an Abstract Setting