Model Generalization

Model generalization, the ability of a machine learning model to perform well on unseen data, is a central challenge in the field. Current research focuses on improving generalization through techniques like sharpness-aware minimization (finding flatter minima in the loss landscape), data augmentation (especially learnable augmentation to address bias), and coreset selection (using influence functions to identify the most informative training data). These efforts, often applied to various architectures including large language models and convolutional neural networks, aim to enhance model robustness and reliability across diverse datasets and real-world applications, ultimately leading to more trustworthy and effective AI systems.

Papers

January 31, 2024

Continuous Unsupervised Domain Adaptation Using Stabilized Representations and Experience Replay
Mohammad Rostami
Domain Adaptation Continual LEArning Unsupervised Domain Adaptation Domain Shift Model Generalization Experience Replay Stationary Representation

January 14, 2024

Enhanced Few-Shot Class-Incremental Learning via Ensemble Models
Mingli Zhu, Zihao Zhu, Sihong Chen, Chen Chen, Baoyuan Wu
Training Data Class Incremental Learning Ensemble Model Model Generalization Novel Ensemble

January 3, 2024

Answering from Sure to Uncertain: Uncertainty-Aware Curriculum Learning for Video Question Answering
Haopeng Li, Qiuhong Ke, Mingming Gong, Tom Drummond
Curriculum Learning Video Question Answering Model Generalization Multiple Choice VideoQA Video Question Uncertain Reasoning VideoQA Model Yes Yes

November 6, 2023

SoK: Memorisation in machine learning
Dmitrii Usynin, Moritz Knolle, Georgios Kaissis
Machine Learning Strong Generalization Machine Learning Model Differential Privacy Model Generalization Memorisation Profile

November 3, 2023

On the Generalization Properties of Diffusion Models
Puheng Li, Zhong Li, Huishuai Zhang, Jiang Bian
Diffusion Model Generative Model Model Generalization Score Based Diffusion Model Generalization Gap Generalization Property

October 24, 2023

Improving generalization in large language models by learning prefix subspaces
Louis Falissard, Vincent Guigue, Laure Soulier
Large Language Model Strong Generalization Shot Learning Parameter Efficient Fine Tuning Model Generalization Deep Subspace Linear Subspace

October 19, 2023

On the Optimization and Generalization of Multi-head Attention
Puneesh Deora, Rouzbeh Ghaderi, Hossein Taheri, Christos Thrampoulidis
Strong Generalization Optimization Purpose Attention Mechanism Model Generalization Multi Head Self Attention Attention Head

October 18, 2023

Improving Generalization of Alignment with Human Preferences through Group Invariant Learning
Rui Zheng, Wei Shen, Yuan Hua, Wenbin Lai, Shihan Dou, Yuhao Zhou, Zhiheng Xi, Xiao Wang, Haoran Huang, Tao Gui, Qi Zhang, Xuanjing Huang
Language Model Reinforcement Learning Strong Generalization Alignment Problem Human Preference Model Generalization AI Assistant Group Invariant

October 6, 2023

September 22, 2023

Towards Counterfactual Fairness-aware Domain Generalization in Changing Environments
Yujie Lin, Chen Zhao, Minglai Shao, Baoluo Meng, Xujiang Zhao, Haifeng Chen
Domain Generalization Domain Shift Environment Feature Model Generalization Fairness Regularization

September 12, 2023

Exploring Flat Minima for Domain Generalization with Large Learning Rates
Jian Zhang, Lei Qi, Yinghuan Shi, Yang Gao
Domain Generalization Model Generalization Target Domain Flat Minimum Large Learning Rate

August 28, 2023

LatentDR: Improving Model Generalization Through Sample-Aware Latent Degradation and Restoration
Ran Liu, Sahil Khose, Jingyun Xiao, Lakshmi Sathidevi, Keerthan Ramnath, Zsolt Kira, Eva L. Dyer
Data Augmentation Latent Space Model Generalization Restoration Quality Space Augmentation Domain Variation Latent Degradation

August 4, 2023

Frustratingly Easy Model Generalization by Dummy Risk Minimization
Juncheng Wang, Jindong Wang, Xixu Hu, Shujun Wang, Xing Xie
Distribution Generalization Empirical Risk Minimization Model Generalization Risk Minimization

June 29, 2023

Traceable Group-Wise Self-Optimizing Feature Transformation Learning: A Dual Optimization Perspective
Meng Xiao, Dongjie Wang, Min Wu, Kunpeng Liu, Hui Xiong, Yuanchun Zhou, Yanjie Fu
Model Generalization Feature Transformation Optimal Representation Dual Optimization

June 17, 2023

The RL Perceptron: Generalisation Dynamics of Policy Learning in High Dimensions
Nishil Patel, Sebastian Lee, Stefano Sarao Mannelli, Sebastian Goldt, Andrew Saxe
Reinforcement Learning High Dimensional Policy Learning Sparse Reward High Dimension Model Generalization

June 9, 2023

Design Principles for Model Generalization and Scalable AI Integration in Radio Access Networks
Pablo Soldati, Euhanna Ghadimi, Burak Demirel, Yu Wang, Raimundas Gaigalas, Mathias Sintorn
Artificial Intelligence Model Generalization Design Principle Wireless System Radio Environment

May 25, 2023

Generative Adversarial Reduced Order Modelling
Dario Coscia, Nicola Demo, Gianluigi Rozza
Generative Adversarial Network GAN Model Model Generalization Based Reduced Order Model Data Driven Generative

May 14, 2023

Make Prompt-based Black-Box Tuning Colorful: Boosting Model Generalization from Three Orthogonal Perspectives
Qiushi Sun, Chengcheng Han, Nuo Chen, Renyu Zhu, Jingyang Gong, Xiang Li, Ming Gao
Large Language Model Shot Learning Language Understanding Black Box Optimization Model Generalization Black Box Tuning

May 3, 2023

Synthetic DOmain-Targeted Augmentation (S-DOTA) Improves Model Generalization in Digital Pathology
Sai Chowdary Gullapally, Yibo Zhang, Nitin Kumar Mittal, Deeksha Kartik, Sandhya Srinivasan, Kevin Rose, Daniel Shenker, Dinkar Juyal, Harshith Padigela, Raymond Biju, Victor Minden, Chirag Maheshwari, Marc Thibault, Zvi Goldstein, Luke Novak, Nidhi Chandra, Justin Lee, Aaditya Prakash, Chintan Shah, John Abel, Darren Fahy, Amaro Taylor-Weiner, Anand Sampat
Domain Shift Digital Pathology Model Generalization Tissue Segmentation Multiplayer Online Battle Arena Stain Augmentation Domain Augmentation

Model Generalization

Papers

Continuous Unsupervised Domain Adaptation Using Stabilized Representations and Experience Replay

Enhanced Few-Shot Class-Incremental Learning via Ensemble Models

Answering from Sure to Uncertain: Uncertainty-Aware Curriculum Learning for Video Question Answering

SoK: Memorisation in machine learning

On the Generalization Properties of Diffusion Models

Improving generalization in large language models by learning prefix subspaces

On the Optimization and Generalization of Multi-head Attention

Improving Generalization of Alignment with Human Preferences through Group Invariant Learning

CIFAR-10-Warehouse: Broad and More Realistic Testbeds in Model Generalization Analysis

Anonymous Learning via Look-Alike Clustering: A Precise Analysis of Model Generalization

Towards Counterfactual Fairness-aware Domain Generalization in Changing Environments

Exploring Flat Minima for Domain Generalization with Large Learning Rates

LatentDR: Improving Model Generalization Through Sample-Aware Latent Degradation and Restoration

Frustratingly Easy Model Generalization by Dummy Risk Minimization

Traceable Group-Wise Self-Optimizing Feature Transformation Learning: A Dual Optimization Perspective

The RL Perceptron: Generalisation Dynamics of Policy Learning in High Dimensions

Design Principles for Model Generalization and Scalable AI Integration in Radio Access Networks

Generative Adversarial Reduced Order Modelling

Make Prompt-based Black-Box Tuning Colorful: Boosting Model Generalization from Three Orthogonal Perspectives

Synthetic DOmain-Targeted Augmentation (S-DOTA) Improves Model Generalization in Digital Pathology