Rationale Alignment

Rationale alignment focuses on improving the interpretability and reliability of AI models by aligning their internal decision-making processes (rationales) with human understanding and desired outcomes. Current research emphasizes enriching training data with machine-generated or human-annotated rationales, exploring various model architectures like large language models and graph neural networks to generate and utilize these explanations, and developing new evaluation metrics to assess the quality and utility of rationales. This work is significant because improved rationale alignment enhances model transparency, trustworthiness, and ultimately, the safe and effective deployment of AI systems across diverse applications.

Papers

June 27, 2023

FAIRER: Fairness as Decision Rationale Alignment
Tianlin Li, Qing Guo, Aishan Liu, Mengnan Du, Zhiming Li, Yang Liu
Deep Neural Network Procedural Fairness Rationale Alignment Fairness Regularization Fairness Loss Fair Prediction Neuron Alignment

May 23, 2023

HOP, UNION, GENERATE: Explainable Multi-hop Reasoning without Rationale Supervision
Wenting Zhao, Justin T. Chiu, Claire Cardie, Alexander M. Rush
Multi Hop Reasoning Multi Hop Question Answering Generate Quick Rationale Alignment Multi Hop Question Human Annotated Rationale Basin Hopping

May 11, 2023

Are Machine Rationales (Not) Useful to Humans? Measuring and Improving Human Utility of Free-Text Rationales
Brihi Joshi, Ziyi Liu, Sahana Ramnath, Aaron Chan, Zhewei Tong, Shaoliang Nie, Qifan Wang, Yejin Choi, Xiang Ren
Large Language Model Real Human Task Utility Rationale Alignment Convincing Explanation Free Text Rationale

April 30, 2023

Building a Non-native Speech Corpus Featuring Chinese-English Bilingual Children: Compilation and Rationale
Hiuchung Hung, Andreas Maier, Thorsten Piske
Automatic Speech Recognition Speech Corpus Rationale Alignment Planning Based Compilation L2 Speech

February 23, 2023

HL Dataset: Visually-grounded Description of Scenes, Actions and Rationales
Michele Cafagna, Kees van Deemter, Albert Gatt
MAESTRO Dataset COCO Dataset Past Action Description Library Captioning Datasets Rationale Alignment Theatre Scene Description High Quality Caption

January 7, 2023

Faithful and Consistent Graph Neural Network Explanations with Rationale Alignment
Tianxiang Zhao, Dongsheng Luo, Xiang Zhang, Suhang Wang
Inductive Bias Instance Level Distribution Alignment Faithful Explanation Rationale Alignment Graph Neural Network Explanation

November 15, 2022

Reasoning Circuits: Few-shot Multihop Question Generation with Structured Rationales
Saurabh Kulshreshtha, Anna Rumshisky
Question Answering Multi Step Reasoning Rationale Alignment Rationale Generation Multi Hop Question Generation

October 10, 2022

REV: Information-Theoretic Evaluation of Free-Text Rationales
Hanjie Chen, Faeze Brahman, Xiang Ren, Yangfeng Ji, Yejin Choi, Swabha Swayamdipta
Natural Language Processing Rationale Alignment Free Text Rationale

June 6, 2022

Graph Rationalization with Environment-based Augmentations
Gang Liu, Tong Zhao, Jiaxin Xu, Tengfei Luo, Meng Jiang
Graph Pooling Rationale Alignment Graph Rationale

May 25, 2022

Investigating the Benefits of Free-Form Rationales
Jiao Sun, Swabha Swayamdipta, Jonathan May, Xuezhe Ma
Complementary Benefit Model Interpretability Rationale Alignment Rationale Generation Free Text Rationale

January 13, 2022

Making a (Counterfactual) Difference One Rationale at a Time
Mitchell Plyler, Michael Green, Min Chi
Natural Language Processing Time Matter Qualitative Difference Rationale Alignment Counterfactual Data Augmentation Rationale Generation Spurious Pattern

November 30, 2021

What to Learn, and How: Toward Effective Learning from Rationales
Samuel Carton, Surya Kanoria, Chenhao Tan
Rationale Alignment Human Annotated Rationale Effective Learning