Explainability Method

Explainability methods aim to make the decision-making processes of complex machine learning models, particularly deep neural networks and large language models, more transparent and understandable. Current research focuses on developing and evaluating methods that assess the faithfulness and plausibility of explanations, often using techniques like counterfactual generation, attribution methods (e.g., SHAP, LIME, Grad-CAM), and concept-based approaches. This work is crucial for building trust in AI systems across diverse applications, from medical diagnosis to autonomous vehicles, by providing insights into model behavior and identifying potential biases.

Papers

May 25, 2024

Front-propagation Algorithm: Explainable AI Technique for Extracting Linear Function Approximations from Neural Networks
Javier Viaña
Neural Network Deep Neural Network Explainability Method Linear Function Approximation Front Propagation

May 23, 2024

Applied Machine Learning to Anomaly Detection in Enterprise Purchase Processes
A. Herreros-Martínez, R. Magdalena-Benedicto, J. Vila-Francés, A. J. Serrano-López, S. Pérez-Díaz
Anomaly Detection Unsupervised Learning Explainability Method Exploratory Data Analysis DBSCAN Algorithm

May 17, 2024

ECATS: Explainable-by-design concept-based anomaly detection for time series
Irene Ferfoglia, Gaia Saveri, Laura Nenzi, Luca Bortolussi
Time Series Explainability Method Signal Temporal Logic Cyber Physical Concept Embeddings Neuro Symbolic Architecture

May 14, 2024

Challenges and Opportunities in Text Generation Explainability
Kenza Amara, Rita Sevastjanova, Mennatallah El-Assady
Natural Language Processing Technical Challenge Emerging Opportunity Explainability Method Attribution Based Explainable Machine Learning Pipeline

May 13, 2024

Evaluating the Explainable AI Method Grad-CAM for Breath Classification on Newborn Time Series Data
Camelia Oprea, Mike Grüne, Mateusz Buglowski, Lena Olivier, Thorsten Orlikowsky, Stefan Kowalewski, Mark Schoberer, André Stollenwerk
Artificial Intelligence Explainability Method Explanation Method Grad CAM

April 29, 2024

FALE: Fairness-Aware ALE Plots for Auditing Bias in Subgroups
Giorgos Giannopoulos, Dimitris Sacharidis, Nikolas Theologitis, Loukas Kavouras, Ioannis Emiris
Absolute Stance Bias Explainability Method Potential Bias Subgroup Description Subgroup Fairness Bias Auditing Relative Stance Bias

April 9, 2024

Studying the Impact of Latent Representations in Implicit Neural Networks for Scientific Continuous Field Reconstruction
Wei Xu, Derek Freeman DeSantis, Xihaier Luo, Avish Parmar, Klaus Tan, Balu Nadiga, Yihui Ren, Shinjae Yoo
Global Impact Latent Representation Explainability Method Implicit Neural Network Gabor Filter Field Reconstruction

April 4, 2024

LeGrad: An Explainability Method for Vision Transformers via Feature Formation Sensitivity
Walid Bousselham, Angie Boggust, Sofian Chaybouti, Hendrik Strobelt, Hilde Kuehne
Vision Transformer Computer Vision Attention Map Explainability Method Sensitivity Aware Explanation Map

April 3, 2024

Exploring the Trade-off Between Model Performance and Explanation Plausibility of Text Classifiers Using Human Rationales
Lucas E. Resck, Marcos M. Raimundo, Jorge Poco
Contrastive Learning Model Performance Model Explanation Explainability Method Post Hoc Explanation Text Classifier Explanation Plausibility Post Hoc Explainability

March 29, 2024

Does Faithfulness Conflict with Plausibility? An Empirical Study in Explainable AI across NLP Tasks
Xiaolei Lu, Jianghong Ma
Explainable AI High Explainability Empirical Study NLP Task Explainability Method Explanation Plausibility Faithfulness Test Explanation Algorithm

March 27, 2024

Enhancing Manufacturing Quality Prediction Models through the Integration of Explainability Methods
Dennis Gross, Helge Spieker, Arnaud Gotlieb, Ricardo Knoblauch
Machine Learning Predictive Model Explainability Method Explainability Technique Milling Process

March 19, 2024

Advancing Explainable Autonomous Vehicle Systems: A Comprehensive Review and Research Roadmap
Sule Tekkesinoglu, Azra Habibovic, Lars Kunze
Autonomous Vehicle Comprehensive Review Explainability Method Trustworthy Autonomous

March 7, 2024

Explainable Face Verification via Feature-Guided Gradient Backpropagation
Yuhang Lu, Zewei Xu, Touradj Ebrahimi
Face Recognition Saliency Map Explainability Method Gradient Backpropagation Explainable Face

February 29, 2024

Evaluating Webcam-based Gaze Data as an Alternative for Human Rationale Annotations
Stephanie Brandl, Oliver Eberle, Tiago Ribeiro, Anders Søgaard, Nora Hollenstein
Explainability Method Gaze Data Human Annotated Rationale Attention Entropy Feature Importance Explanation

February 26, 2024

Towards Explainability and Fairness in Swiss Judgement Prediction: Benchmarking on a Multilingual Dataset
Santosh T. Y. S. S, Nina Baumgartner, Matthias Stürmer, Matthias Grabmair, Joel Niklaus
Procedural Fairness High Explainability Multilingual Dataset Explainability Method Legal Judgment Prediction Explanation Performance

February 22, 2024

Reimagining Anomalies: What If Anomalies Were Normal?
Philipp Liznerski, Saurabh Varshneya, Ece Calikus, Sophie Fellenz, Marius Kloft
Unlabeled Anomaly Explainability Method State of the Art Anomaly Image Anomaly Detection Anomaly Detector

February 17, 2024

Trust Regions for Explanations via Black-Box Probabilistic Certification
Amit Dhurandhar, Swagatam Haldar, Dennis Wei, Karthikeyan Natesan Ramamurthy
Line by Line Explanation Black Box Black Box Model Explainability Method Trust Region

February 16, 2024

Towards Uncovering How Large Language Model Works: An Explainability Perspective
Haiyan Zhao, Fan Yang, Bo Shen, Himabindu Lakkaraju, Mengnan Du
Large Language Model High Explainability Explainability Method Mechanistic Interpretability LLM Representation Representation Engineering

February 14, 2024

SyntaxShap: Syntax-aware Explainability Method for Text Generation
Kenza Amara, Rita Sevastjanova, Mennatallah El-Assady
Text Generation Line by Line Explanation Explainability Method Model Interpretability Code Syntax Syntactic Dependency Model Agnostic Explainability

February 6, 2024

Variational Shapley Network: A Probabilistic Approach to Self-Explaining Shapley values with Uncertainty Quantification
Mert Ketenci, Iñigo Urteaga, Victor Alfonso Rodriguez, Noémie Elhadad, Adler Perotte
Uncertainty Quantification Shapley Value Explainability Method Marginal Distribution Probabilistic Approach Self Explaining Variational Neural Network

Explainability Method

Papers

Front-propagation Algorithm: Explainable AI Technique for Extracting Linear Function Approximations from Neural Networks

Applied Machine Learning to Anomaly Detection in Enterprise Purchase Processes

ECATS: Explainable-by-design concept-based anomaly detection for time series

Challenges and Opportunities in Text Generation Explainability

Evaluating the Explainable AI Method Grad-CAM for Breath Classification on Newborn Time Series Data

FALE: Fairness-Aware ALE Plots for Auditing Bias in Subgroups

Studying the Impact of Latent Representations in Implicit Neural Networks for Scientific Continuous Field Reconstruction

LeGrad: An Explainability Method for Vision Transformers via Feature Formation Sensitivity

Exploring the Trade-off Between Model Performance and Explanation Plausibility of Text Classifiers Using Human Rationales

Does Faithfulness Conflict with Plausibility? An Empirical Study in Explainable AI across NLP Tasks

Enhancing Manufacturing Quality Prediction Models through the Integration of Explainability Methods

Advancing Explainable Autonomous Vehicle Systems: A Comprehensive Review and Research Roadmap

Explainable Face Verification via Feature-Guided Gradient Backpropagation

Evaluating Webcam-based Gaze Data as an Alternative for Human Rationale Annotations

Towards Explainability and Fairness in Swiss Judgement Prediction: Benchmarking on a Multilingual Dataset

Reimagining Anomalies: What If Anomalies Were Normal?

Trust Regions for Explanations via Black-Box Probabilistic Certification

Towards Uncovering How Large Language Model Works: An Explainability Perspective

SyntaxShap: Syntax-aware Explainability Method for Text Generation

Variational Shapley Network: A Probabilistic Approach to Self-Explaining Shapley values with Uncertainty Quantification