Model Generalization

Model generalization, the ability of a machine learning model to perform well on unseen data, is a central challenge in the field. Current research focuses on improving generalization through techniques like sharpness-aware minimization (finding flatter minima in the loss landscape), data augmentation (especially learnable augmentation to address bias), and coreset selection (using influence functions to identify the most informative training data). These efforts, often applied to various architectures including large language models and convolutional neural networks, aim to enhance model robustness and reliability across diverse datasets and real-world applications, ultimately leading to more trustworthy and effective AI systems.

Papers

June 25, 2024

ET tu, CLIP? Addressing Common Object Errors for Unseen Environments
Ye Won Byun, Cathy Jiao, Shahriar Noroozizadeh, Jimin Sun, Rosa Vitiello
Single CLIP Model Generalization Visual Encoder Unseen Environment Auxiliary Classifier Episodic Training

June 18, 2024

Advancing Cross-Domain Generalizability in Face Anti-Spoofing: Insights, Design, and Metrics
Hyojin Kim, Jiyoon Lee, Yonghyun Jeong, Haneol Jang, YoungJoon Yoo
Zero Shot Product Design DCU Insight AQ Metric Library Model Generalization Face Anti Spoofing Anti Spoofing Domain Generalizability Generalization Characteristic

June 13, 2024

Assessing Model Generalization in Vicinity
Yuchi Liu, Yifan Sun, Jingdong Wang, Liang Zheng
Model Generalization Model Accuracy Distribution Datasets Distribution Accuracy Generalization Measure

June 11, 2024

Agnostic Sharpness-Aware Minimization
Van-Anh Nguyen, Quyen Tran, Tuan Truong, Thanh-Toan Do, Dinh Phung, Trung Le
Strong Generalization Sharpness Aware Minimization Model Generalization Generalization Property Model Agnostic Meta Learning

June 10, 2024

Improving Generalization of Neural Vehicle Routing Problem Solvers Through the Lens of Model Architecture
Yubin Xiao, Di Wang, Xuan Wu, Yuesong Wu, Boyang Li, Wei Du, Liupu Wang, You Zhou
Strong Generalization Camera Lens Distribution Generalization Model Generalization Model Architecture Vehicle Routing Problem Model Generalizability Generalization Strategy

June 7, 2024

May 6, 2024

Gaussian Stochastic Weight Averaging for Bayesian Low-Rank Adaptation of Large Language Models
Emre Onal, Klemens Flöge, Emma Caldwell, Arsen Sheverdin, Vincent Fortuin
Natural Language Processing Adaptation Concern Model Generalization Fine Tuned Large Language Model Approximate Bayesian Inference Stochastic Weight Averaging

May 3, 2024

April 24, 2024

Generalization Measures for Zero-Shot Cross-Lingual Transfer
Saksham Bassi, Duygu Ataman, Kyunghyun Cho
Language Model Cross Lingual Transfer Model Generalization Zero Shot Cross Lingual Generalization Measure

March 21, 2024

An Analysis of Linear Time Series Forecasting Models
William Toner, Luke Darlow
General Analysis Time Series Forecasting Model Generalization Linear Model Model Architecture Linear Forecasting

March 11, 2024

On the Generalization Ability of Unsupervised Pretraining
Yuyang Deng, Junyuan Hong, Jiayu Zhou, Mehrdad Mahdavi
Fine Tuning Fine Tuned Model Model Generalization Unsupervised Pre Training

March 8, 2024

Synthetic data generation for system identification: leveraging knowledge transfer from similar systems
Dario Piga, Matteo Rufolo, Gabriele Maroni, Manas Mejari, Marco Forgione
Synthetic Data Dynamical System Knowledge Transfer Synthetic Data Generation Model Generalization System Identification Similar System

March 7, 2024

Privacy-preserving Fine-tuning of Large Language Models through Flatness
Tiejin Chen, Longchao Da, Huixue Zhou, Pingzhi Li, Kaixiong Zhou, Tianlong Chen, Hua Wei
Fine Tuning Differential Privacy Model Generalization Private Fine Tuning Document Flattening

March 6, 2024

On Transfer in Classification: How Well do Subsets of Classes Generalize?
Raphael Baena, Lucas Drumetz, Vincent Gripon
Classification Code Shot Learning Formality Transfer Task Transferability Model Generalization High Quality Subset Efficient Transfer

February 20, 2024

Learning Generalization and Regularization of Nonhomogeneous Temporal Poisson Processes
Son Nguyen Van, Hoai Nguyen Xuan
Model Generalization Poisson Process Binning Method

February 16, 2024

February 8, 2024

GenEFT: Understanding Statics and Dynamics of Model Generalization via Effective Theory
David D. Baek, Ziming Liu, Max Tegmark
Strong Generalization Representation Learning Model Generalization Neural Network Generalization Solid Mechanic Latent Space Representation Effective Theory Generalization Phase Transition

Model Generalization

Papers

ET tu, CLIP? Addressing Common Object Errors for Unseen Environments

Advancing Cross-Domain Generalizability in Face Anti-Spoofing: Insights, Design, and Metrics

Assessing Model Generalization in Vicinity

Agnostic Sharpness-Aware Minimization

Improving Generalization of Neural Vehicle Routing Problem Solvers Through the Lens of Model Architecture

Individual Packet Features are a Risk to Model Generalisation in ML-Based Intrusion Detection

Cooperative Meta-Learning with Gradient Augmentation

Gaussian Stochastic Weight Averaging for Bayesian Low-Rank Adaptation of Large Language Models

Quantifying Distribution Shifts and Uncertainties for Enhanced Model Robustness in Machine Learning Applications

Position: Understanding LLMs Requires More Than Statistical Generalization

Generalization Measures for Zero-Shot Cross-Lingual Transfer

An Analysis of Linear Time Series Forecasting Models

On the Generalization Ability of Unsupervised Pretraining

Synthetic data generation for system identification: leveraging knowledge transfer from similar systems

Privacy-preserving Fine-tuning of Large Language Models through Flatness

On Transfer in Classification: How Well do Subsets of Classes Generalize?

Learning Generalization and Regularization of Nonhomogeneous Temporal Poisson Processes

Kolmogorov n-Widths for Multitask Physics-Informed Machine Learning (PIML) Methods: Towards Robust Metrics

Instruction Diversity Drives Generalization To Unseen Tasks

GenEFT: Understanding Statics and Dynamics of Model Generalization via Effective Theory