Bias Evaluation

Bias evaluation in machine learning focuses on identifying and quantifying unfair biases in models' outputs, aiming to promote fairness and mitigate discriminatory outcomes. Current research emphasizes developing new metrics and benchmarks to assess bias across diverse model architectures, including large language models and computer vision systems, often employing techniques like counterfactual analysis and probing methods to detect subtle biases. This work is crucial for ensuring the responsible development and deployment of AI systems, impacting fields ranging from healthcare and criminal justice to social media and autonomous driving, where biased algorithms can have significant societal consequences.

Papers

April 29, 2024

LangBiTe: A Platform for Testing Bias in Large Language Models
Sergio Morales, Robert Clarisó, Jordi Cabot
Diverse Platform Bias Evaluation Test Environment Test Scenario

April 28, 2024

Bias Neutralization Framework: Measuring Fairness in Large Language Models with Bias Intelligence Quotient (BiQ)
Malur Narayan, John Pasmore, Elton Sampaio, Vijay Raghavan, Gabriella Waters
Language Model Procedural Fairness Bias Evaluation Multiple Bias

April 23, 2024

April 9, 2024

FairPair: A Robust Evaluation of Biases in Language Models through Paired Perturbations
Jane Dwivedi-Yu, Raaz Dwivedi, Timo Schick
Language Model Generative Model High Quality Counterfactuals Topic Bias Bias Evaluation Additive Perturbation Robust Evaluation Realistic Evaluation

April 4, 2024

The Impact of Unstated Norms in Bias Analysis of Language Models
Farnaz Kohankhaki, D. B. Emerson, Jacob-Junqi Tian, Laleh Seyyed-Kalantari, Faiza Khan Khattak
Large Language Model Language Model Global Impact Absolute Stance Bias Stereotype Content Bias Evaluation Learning Norm LLM Bias Bias Measurement

April 2, 2024

Stereotype Detection in LLMs: A Multiclass, Explainable, and Benchmark-Driven Approach
Zekun Wu, Sahan Bulathwela, Maria Perez-Ortiz, Adriano Soares Koshiyama
Language Model Stereotype Content Bias Evaluation Stereotype Detection

March 13, 2024

MoleculeQA: A Dataset to Evaluate Factual Accuracy in Molecular Comprehension
Xingyu Lu, He Cao, Zijing Liu, Shengyuan Bai, Leqing Chen, Yuan Yao, Hai-Tao Zheng, Yu Li
Data Set Bias Evaluation Molecular Information Factual Accuracy Biomedical Corpus

February 25, 2024

Cognitive Bias in High-Stakes Decision-Making with LLMs
Jessica Echterhoff, Yao Liu, Abeer Alessa, Julian McAuley, Zexue He
Large Language Model Bias Mitigation Bias Evaluation Cognitive Bias

February 22, 2024

COBIAS: Contextual Reliability in Bias Assessment
Priyanshul Govil, Hemang Jain, Vamshi Krishna Bonagiri, Aman Chadha, Ponnurangam Kumaraguru, Manas Gaur, Sanorita Dey
Bias Evaluation Contextual Biasing Model Debiasing Bias Benchmark Contextual Reliability

February 20, 2024

Bias in Language Models: Beyond Trick Tests and Toward RUTEd Evaluation
Kristian Lum, Jacy Reese Anthis, Chirag Nagpal, Alexander D'Amour
Language Model Absolute Stance Bias Bias Evaluation Unconventional Rabbit Hat Trick Bias Benchmark

February 17, 2024

BiasBuster: a Neural Approach for Accurate Estimation of Population Statistics using Biased Location Data
Sepanta Zeighami, Cyrus Shahabi
Absolute Stance Bias Bias Evaluation Estimation Performance Neural Approach Sampling Bias Sample Specific Debiasing Population Data

January 19, 2024

Beyond RMSE and MAE: Introducing EAUC to unmask hidden bias and unfairness in dyadic regression models
Jorge Paz-Ruza, Amparo Alonso-Betanzos, Bertha Guijarro-Berdiñas, Brais Cancela, Carlos Eiras-Franco
Bias Evaluation Subtle Bias Predictive Power Dyadic Regression Model

January 16, 2024

The Gaps between Pre-train and Downstream Settings in Bias Evaluation and Debiasing
Masahiro Kaneko, Danushka Bollegala, Timothy Baldwin
Fine Tuning Pre Trained Language Model Context Learning Filling Gap Bias Evaluation Self Debiasing Intrinsic Bias Downstream Fine Tuning Based Debiasing

December 11, 2023

November 15, 2023

Social Bias Probing: Fairness Benchmarking for Language Models
Marta Marchiori Manerba, Karolina Stańczak, Riccardo Guidotti, Isabelle Augenstein
Language Model Social Bias Bias Evaluation Stereotypical Bias Fairness Benchmark Bias Challenge

November 11, 2023

Don't Overlook the Grammatical Gender: Bias Evaluation for Hindi-English Machine Translation
Pushpdeep Singh
Neural Machine Translation Bias Evaluation Grammatical Gender

November 7, 2023

Gender Inflected or Bias Inflicted: On Using Grammatical Gender Cues for Bias Evaluation in Machine Translation
Pushpdeep Singh
Machine Translation Neural Machine Translation Gender Information Bias Evaluation Bias Related Issue Grammatical Gender

November 1, 2023

Can Large Language Models Capture Public Opinion about Global Warming? An Empirical Assessment of Algorithmic Fidelity and Bias
S. Lee, T. Q. Peng, M. H. Goldberg, S. A. Rosenthal, J. E. Kotcher, E. W. Maibach, A. Leiserowitz
Large Language Model Language Model Absolute Stance Bias Bias Evaluation Empirical Evaluation Climate Change Research Survey

Bias Evaluation

Papers

LangBiTe: A Platform for Testing Bias in Large Language Models

Bias Neutralization Framework: Measuring Fairness in Large Language Models with Bias Intelligence Quotient (BiQ)

Bias patterns in the application of LLMs for clinical decision support: A comprehensive study

Sum of Group Error Differences: A Critical Examination of Bias Evaluation in Biometric Verification and a Dual-Metric Measure

FairPair: A Robust Evaluation of Biases in Language Models through Paired Perturbations

The Impact of Unstated Norms in Bias Analysis of Language Models

Stereotype Detection in LLMs: A Multiclass, Explainable, and Benchmark-Driven Approach

MoleculeQA: A Dataset to Evaluate Factual Accuracy in Molecular Comprehension

Cognitive Bias in High-Stakes Decision-Making with LLMs

COBIAS: Contextual Reliability in Bias Assessment

Bias in Language Models: Beyond Trick Tests and Toward RUTEd Evaluation

BiasBuster: a Neural Approach for Accurate Estimation of Population Statistics using Biased Location Data

Beyond RMSE and MAE: Introducing EAUC to unmask hidden bias and unfairness in dyadic regression models

The Gaps between Pre-train and Downstream Settings in Bias Evaluation and Debiasing

GPTBIAS: A Comprehensive Framework for Evaluating Bias in Large Language Models

Attribute Annotation and Bias Evaluation in Visual Datasets for Autonomous Driving

Social Bias Probing: Fairness Benchmarking for Language Models

Don't Overlook the Grammatical Gender: Bias Evaluation for Hindi-English Machine Translation

Gender Inflected or Bias Inflicted: On Using Grammatical Gender Cues for Bias Evaluation in Machine Translation

Can Large Language Models Capture Public Opinion about Global Warming? An Empirical Assessment of Algorithmic Fidelity and Bias