Implicit Bias

Implicit bias refers to unintended, often subtle, biases embedded within machine learning models, stemming from biases present in their training data. Current research focuses on detecting and mitigating these biases in various model architectures, particularly large language models (LLMs) and deep neural networks, using techniques like prompt engineering, fine-tuning, and Bayesian methods. Understanding and addressing implicit bias is crucial for ensuring fairness and equity in AI applications, impacting fields ranging from healthcare and criminal justice to education and hiring. The development of robust bias detection and mitigation strategies is a central goal of ongoing research.

Papers

July 3, 2024

How JEPA Avoids Noisy Features: The Implicit Bias of Deep Linear Self Distillation Networks
Etai Littwin, Omid Saremi, Madhu Advani, Vimal Thilak, Preetum Nakkiran, Chen Huang, Joshua Susskind
Self Supervised Learning Latent Representation Implicit Bias Masked AutoEncoder Deep Linear Similar Representation Joint Embedding Predictive Architecture

July 1, 2024

June 30, 2024

Evaluation of Bias Towards Medical Professionals in Large Language Models
Xi Chen, Yang Xu, MingKe You, Li Wang, WeiZhi Liu, Jian Li
Global Evaluation Absolute Stance Bias Implicit Bias Gender Information Racial Bias Medical Student

June 25, 2024

Do they mean 'us'? Interpreting Referring Expressions in Intergroup Bias
Venkata S Govindarajan, Matianyu Zang, Kyle Mahowald, David Beaver, Junyi Jessy Li
Implicit Bias Referring Expression

June 20, 2024

June 18, 2024

Implicit Bias of Mirror Flow on Separable Data
Scott Pesme, Radu-Alexandru Dragomir, Nicolas Flammarion
Implicit Bias Continuous Time Mirror Descent Etruscan Mirror Margin Classifier Separable Data Reflection Flow

June 15, 2024

The Implicit Bias of Adam on Separable Data
Chenyang Zhang, Difan Zou, Yuan Cao
Deep Learning Gradient Descent Implicit Bias Logistic Regression Linear Classifier Separable Data

June 7, 2024

The Price of Implicit Bias in Adversarially Robust Generalization
Nikolaos Tsilivis, Natalie Frank, Nathan Srebro, Julia Kempe
Native Robustness Adversarial Perturbation Empirical Risk Minimization Implicit Bias Robust Generalization Curious Price Truly Robust Case

May 24, 2024

Can Implicit Bias Imply Adversarial Robustness?
Hancheng Min, René Vidal
Adversarial Attack Adversarial Robustness Implicit Bias Shallow Network Polynomial Activation Adversarial Bias

May 6, 2024

FairMonitor: A Dual-framework for Detecting Stereotypes and Biases in Large Language Models
Yanhong Bai, Jiabao Zhao, Jinxin Shi, Zhentao Xie, Xingjiao Wu, Liang He
Implicit Bias Topic Bias Subtle Bias Association Test Stereotype Detection

April 18, 2024

Reducing Bias in Pre-trained Models by Tuning while Penalizing Change
Niklas Penzel, Gideon Stein, Joachim Denzler
Pre Trained Model Deep Model Implicit Bias Pre Change Information Frozen Pre Trained

April 8, 2024

DRoP: Distributionally Robust Pruning
Artem Vysogorets, Kartik Ahuja, Julia Kempe
Deep Learning Implicit Bias Data Pruning Biased Classifier Robust Pruning

April 5, 2024

Implicit Bias of AdamW: $\ell_\infty$ Norm Constrained Optimization
Shuo Xie, Zhiyuan Li
Regularization Model Implicit Bias Weight Decay Learning Rate Schedule Steepest Descent Path Norm

April 3, 2024

Towards detecting unanticipated bias in Large Language Models
Anna Kruspe
Implicit Bias Inherent Bias Fairness Issue Common Bias Bias Related Issue

March 3, 2024

The Implicit Bias of Heterogeneity towards Invariance: A Study of Multi-Environment Matrix Sensing
Yang Xu, Yihong Gu, Cong Fang
Causal Relationship Causal Pattern Implicit Bias Alpha Invariance Causal Knowledge

February 28, 2024

Implicit Optimization Bias of Next-Token Prediction in Linear Models
Christos Thrampoulidis
Large Language Model Gradient Descent Implicit Bias Next Token Prediction Next Token

February 13, 2024

Implicit Bias in Noisy-SGD: With Applications to Differentially Private Training
Tom Sander, Maxime Sylvestre, Alain Durmus
Financial Application Stochastic Gradient Descent Implicit Bias Differential Privacy SGD Private Model Training

February 12, 2024

Implicit Bias of Policy Gradient in Linear Quadratic Control: Extrapolation to Unseen Initial States
Noam Razin, Yotam Alexander, Edo Cohen-Karlik, Raja Giryes, Amir Globerson, Nadav Cohen
Reinforcement Learning Policy Gradient Implicit Bias Extrapolation Framework Linear Quadratic Regulator Learned Controller

Implicit Bias

Papers

How JEPA Avoids Noisy Features: The Implicit Bias of Deep Linear Self Distillation Networks

Toward Automated Detection of Biased Social Signals from the Content of Clinical Conversations

The African Woman is Rhythmic and Soulful: Evaluation of Open-ended Generation for Implicit Biases

Evaluation of Bias Towards Medical Professionals in Large Language Models

Do they mean 'us'? Interpreting Referring Expressions in Intergroup Bias

Modeling Human Subjectivity in LLMs Using Explicit and Implicit Human Factors in Personas

Evaluating Implicit Bias in Large Language Models by Attacking From a Psychometric Perspective

Implicit Bias of Mirror Flow on Separable Data

The Implicit Bias of Adam on Separable Data

The Price of Implicit Bias in Adversarially Robust Generalization

Can Implicit Bias Imply Adversarial Robustness?

FairMonitor: A Dual-framework for Detecting Stereotypes and Biases in Large Language Models

Reducing Bias in Pre-trained Models by Tuning while Penalizing Change

DRoP: Distributionally Robust Pruning

Implicit Bias of AdamW: $\ell_\infty$ Norm Constrained Optimization

Towards detecting unanticipated bias in Large Language Models

The Implicit Bias of Heterogeneity towards Invariance: A Study of Multi-Environment Matrix Sensing

Implicit Optimization Bias of Next-Token Prediction in Linear Models

Implicit Bias in Noisy-SGD: With Applications to Differentially Private Training

Implicit Bias of Policy Gradient in Linear Quadratic Control: Extrapolation to Unseen Initial States