Linear Probing

Linear probing is a technique used to analyze and understand the internal representations of complex machine learning models, primarily focusing on identifying what information the model has learned and how it's encoded. Current research explores linear probing's application in diverse areas, including assessing copyright infringement in large language models, improving transfer learning via enhanced probing layers (e.g., Kolmogorov-Arnold Networks), and detecting adversarial examples and biases. This methodology offers valuable insights into model interpretability, facilitating the development of more robust, reliable, and ethically sound AI systems across various domains, from natural language processing to medical image analysis.

Papers

June 19, 2024

Explainable by-design Audio Segmentation through Non-Negative Matrix Factorization and Probing
Martin Lebourdais, Théo Mariotte, Antonio Almudévar, Marie Tahon, Alfonso Ortega
Segmentation Performance Linear Probing Interpretable Representation Non Negative Matrix Factorization Audio Segmentation

May 30, 2024

Worse than Random? An Embarrassingly Simple Probing Evaluation of Large Multimodal Models in Medical VQA
Qianqi Yan, Xuehai He, Xiang Yue, Xin Eric Wang
Large Multimodal Model Linear Probing Medical Visual Question Answering Random Participation Modality Invariant Medical VQA

May 27, 2024

Understanding Linear Probing then Fine-tuning Language Models from NTK Perspective
Akiyoshi Tomihari, Issei Sato
Large Language Model Language Model Fine Tuning Transformer Based Model Linear Probing Language Model Fine Tuning

April 10, 2024

Transferable and Efficient Non-Factual Content Detection via Probe Training with Offline Consistency Checking
Xiaokang Zhang, Zijun Yao, Jing Zhang, Kaifeng Yun, Jifan Yu, Juanzi Li, Jie Tang
Linear Probing Factuality Detection Consistency Check

April 2, 2024

LP++: A Surprisingly Strong Linear Probe for Few-Shot CLIP
Yunshi Huang, Fereshteh Shakeri, Jose Dolz, Malik Boudiaf, Houda Bahig, Ismail Ben Ayed
Single CLIP Linear Probing Cover Text Shot Keyword Image Language

March 26, 2024

Decoding Probing: Revealing Internal Linguistic Structures in Neural Language Models using Minimal Pairs
Linyang He, Peili Chen, Ercong Nie, Yuanning Li, Jonathan R. Brennan
Language Model Neural Language Model Linear Probing Linguistic Structure Minimal Pair

February 29, 2024

On the Convergence of Differentially-Private Fine-tuning: To Linearly Probe or to Fully Fine-tune?
Shuqi Ke, Charlie Hou, Giulia Fanti, Sewoong Oh
Fine Tuning Early Stage Convergence Private Data Linear Probing Differentially Private Privacy Budget Private Fine Tuning

February 22, 2024

Q-Probe: A Lightweight Approach to Reward Maximization for Language Models
Kenneth Li, Samy Jelassi, Hugh Zhang, Sham Kakade, Martin Wattenberg, David Brandfonbrener
Language Model Policy Gradient Linear Probing Reward Maximization Task Specific Reward Probe Motion Direct Policy

February 8, 2024

Exploring Visual Culture Awareness in GPT-4V: A Comprehensive Probing
Yong Cao, Wenyan Li, Jiaang Li, Yifei Yuan, Antonia Karamolegkou, Daniel Hershcovich
Large Vision Language Model GPT 4 Linear Probing Visual Understanding Cross CUltural Understanding Benchmark Visual Culture

February 4, 2024

Enhancing Robustness in Biomedical NLI Models: A Probing Approach for Clinical Trials
Ata Mustafa
Native Robustness Textual Entailment Conversational AI Linear Probing Clinical Trial Semantic Understanding NLI Model

January 22, 2024

Enhancing In-context Learning via Linear Probe Calibration
Momin Abbas, Yi Zhou, Parikshit Ram, Nathalie Baracaldo, Horst Samulowitz, Theodoros Salonidis, Tianyi Chen
Natural Language Processing Context Learning Generative Pre Trained Transformer Linear Probing Context Demonstration

December 21, 2023

Probing Biological and Artificial Neural Networks with Task-dependent Neural Manifolds
Michael Kuoch, Chi-Ning Chou, Nikhil Parthasarathy, Joel Dapello, James J. DiCarlo, Haim Sompolinsky, SueYeon Chung
Neural Network Manifold Learning Linear Probing Mechanistic Study Neural Geometry

December 15, 2023

Understanding Probe Behaviors through Variational Bounds of Mutual Information
Kwanghee Choi, Jee-weon Jung, Shinji Watanabe
Mutual Information Information Theory Linear Probing Self Supervised Speech Model Intermediate Representation Separable Representation Variational Bound

December 8, 2023

INSPECT: Intrinsic and Systematic Probing Evaluation for Code Transformers
Anjan Karmakar, Romain Robbes
Source Code Linear Probing Pre Trained Code Model Source Code Model

December 7, 2023

LiDAR: Sensing Linear Probing Performance in Joint Embedding SSL Architectures
Vimal Thilak, Chen Huang, Omid Saremi, Laurent Dinh, Hanlin Goh, Preetum Nakkiran, Joshua M. Susskind, Etai Littwin
Linear Probing Joint Framework Transferable Representation Discriminant Analysis SSL Algorithm Covariance Alignment Linear Discriminant Analysis

November 30, 2023

SocialCounterfactuals: Probing and Mitigating Intersectional Social Biases in Vision-Language Models with Counterfactual Examples
Phillip Howard, Avinash Madasu, Tiep Le, Gustavo Lujan Moreno, Anahita Bhiwandiwalla, Vasudev Lal
Vision Language Model Text to Image Diffusion Model Linear Probing Counterfactual Image Counterfactual Example Intersectional Bias Intersectional Social Attribute

November 25, 2023

Localizing Lying in Llama: Understanding Instructed Dishonesty on True-False Questions Through Prompting, Probing, and Patching
James Campbell, Richard Ren, Phillip Guo
Large Language Model Mechanistic Interpretability Linear Probing Many Prompt

November 7, 2023

Uncovering Intermediate Variables in Transformers using Circuit Probing
Michael A. Lepori, Thomas Serre, Ellie Pavlick
Language Model Transformer Megatron Decepticons Neural Network Model Computation Method Linear Probing Variable Model Large Scale Circuit Digital Circuit

November 1, 2023

Probing Explicit and Implicit Gender Bias through LLM Conditional Text Generation
Xiangjue Dong, Yibo Wang, Philip S. Yu, James Caverlee
Text Generation Gender Bias Gender Information Linear Probing

October 28, 2023

PrObeD: Proactive Object Detection Wrapper
Vishal Asnani, Abhinav Kumar, Suya You, Xiaoming Liu
Object Detection Object Detector Linear Probing Improved Detection

Linear Probing

Papers

Explainable by-design Audio Segmentation through Non-Negative Matrix Factorization and Probing

Worse than Random? An Embarrassingly Simple Probing Evaluation of Large Multimodal Models in Medical VQA

Understanding Linear Probing then Fine-tuning Language Models from NTK Perspective

Transferable and Efficient Non-Factual Content Detection via Probe Training with Offline Consistency Checking

LP++: A Surprisingly Strong Linear Probe for Few-Shot CLIP

Decoding Probing: Revealing Internal Linguistic Structures in Neural Language Models using Minimal Pairs

On the Convergence of Differentially-Private Fine-tuning: To Linearly Probe or to Fully Fine-tune?

Q-Probe: A Lightweight Approach to Reward Maximization for Language Models

Exploring Visual Culture Awareness in GPT-4V: A Comprehensive Probing

Enhancing Robustness in Biomedical NLI Models: A Probing Approach for Clinical Trials

Enhancing In-context Learning via Linear Probe Calibration

Probing Biological and Artificial Neural Networks with Task-dependent Neural Manifolds

Understanding Probe Behaviors through Variational Bounds of Mutual Information

INSPECT: Intrinsic and Systematic Probing Evaluation for Code Transformers

LiDAR: Sensing Linear Probing Performance in Joint Embedding SSL Architectures

SocialCounterfactuals: Probing and Mitigating Intersectional Social Biases in Vision-Language Models with Counterfactual Examples

Localizing Lying in Llama: Understanding Instructed Dishonesty on True-False Questions Through Prompting, Probing, and Patching

Uncovering Intermediate Variables in Transformers using Circuit Probing

Probing Explicit and Implicit Gender Bias through LLM Conditional Text Generation

PrObeD: Proactive Object Detection Wrapper