Model Generalization

Model generalization, the ability of a machine learning model to perform well on unseen data, is a central challenge in the field. Current research focuses on improving generalization through techniques like sharpness-aware minimization (finding flatter minima in the loss landscape), data augmentation (especially learnable augmentation to address bias), and coreset selection (using influence functions to identify the most informative training data). These efforts, often applied to various architectures including large language models and convolutional neural networks, aim to enhance model robustness and reliability across diverse datasets and real-world applications, ultimately leading to more trustworthy and effective AI systems.

Papers

October 10, 2022

The good, the bad and the ugly sides of data augmentation: An implicit spectral regularization perspective
Chi-Heng Lin, Chiraag Kaushik, Eva L. Dyer, Vidya Muthukumar
Data Augmentation Strong Generalization Model Generalization Augmentation Technique Spectral Regularization

September 30, 2022

Ensemble Machine Learning Model Trained on a New Synthesized Dataset Generalizes Well for Stress Prediction Using Wearable Devices
Gideon Vos, Kelly Trinh, Zoltan Sarnyai, Mostafa Rahimi Azghadi
Ensemble Learning Sensor Data Model Generalization Wearable Device Stress Detection Stress Datasets Stress Detection Model Unseen Validation

September 16, 2022

Self-Optimizing Feature Transformation
Meng Xiao, Dongjie Wang, Min Wu, Kunpeng Liu, Hui Xiong, Yuanchun Zhou, Yanjie Fu
Feature Space Model Generalization Feature Engineering Feature Transformation Optimal Representation

September 13, 2022

R\'{e}nyi Divergence Deep Mutual Learning
Weipeng Huang, Junjie Tao, Changbo Deng, Ming Fan, Wenqiang Wan, Qi Xiong, Guangyuan Piao
Stochastic Gradient Descent Model Generalization Mutual Learning KL Divergence R\'enyi Divergence

August 21, 2022

DiscrimLoss: A Universal Loss for Hard Samples and Incorrect Samples Discrimination
Tingting Wu, Xiao Ding, Hao Zhang, Jinglong Gao, Li Du, Bing Qin, Ting Liu
Strong Generalization Self Supervised Curriculum Learning Model Generalization Hard Sample

August 14, 2022

Model Generalization: A Sharpness Aware Optimization Perspective
Jozef Marus Coldenhoff, Chengkun Li, Yurui Zhu
Generalization Performance Sharpness Aware Minimization Model Generalization Sharpness Aware Optimization Sharpness Reduction

July 2, 2022

Eliciting and Learning with Soft Labels from Every Annotator
Katherine M. Collins, Umang Bhatt, Adrian Weller
Machine Learning LeArning Abstract Model Generalization Soft Label Individual Annotator Hard Label

June 10, 2022

Object Detection, Recognition, Deep Learning, and the Universal Law of Generalization
Faris B. Rustom, Haluk Öğmen, Arash Yazdanbakhsh
Deep Learning Strong Generalization Recognition Rate Internal Representation Model Generalization Universal Law

May 27, 2022

Effective Abstract Reasoning with Dual-Contrast Network
Tao Zhuo, Mohan Kankanhalli
Contrastive Learning Model Generalization Abstract Reasoning Rule Engine Progressive Matrix

May 25, 2022

ER-Test: Evaluating Explanation Regularization Methods for Language Models
Brihi Joshi, Aaron Chan, Ziyi Liu, Shaoliang Nie, Maziar Sanjabi, Hamed Firooz, Xiang Ren
Language Model Strong Generalization Neural Language Model Model Generalization Explanation Regularization

May 23, 2022

Towards Model Generalization for Monocular 3D Object Detection
Zhenyu Li, Zehui Chen, Ang Li, Liangji Fang, Qinhong Jiang, Xianming Liu, Junjun Jiang
3D Object Detection 3D Detection Model Generalization Monocular 3D Object Detection Monocular Vision Pixel Wise Depth Generalized Camera

April 11, 2022

Towards Generalizable Semantic Product Search by Text Similarity Pre-training on Search Click Logs
Zheng Liu, Wei Zhang, Yan Chen, Weiyi Sun, Tianchuan Du, Benjamin Schroeder
Fine Tuning Model Generalization Semantic Search Product Retrieval Text Similarity

February 23, 2022

Augmentation based unsupervised domain adaptation
Mauricio Orbes-Arteaga, Thomas Varsavsky, Lauge Sorensen, Mads Nielsen, Akshay Pai, Sebastien Ourselin, Marc Modat, M Jorge Cardoso
Deep Learning Domain Adaptation Deep Learning Model Unsupervised Domain Adaptation Soft Augmentation Model Generalization Adversarial Domain Adaptation

February 8, 2022

Penalizing Gradient Norm for Efficiently Improving Generalization in Deep Learning
Yang Zhao, Hao Zhang, Xiuyuan Hu
Deep Learning Strong Generalization Loss Function Gradient Descent Generalization Performance Gradient Norm Model Generalization

January 28, 2022

With Greater Distance Comes Worse Performance: On the Perspective of Layer Utilization and Model Generalization
James Wang, Cheng-Lin Yang
Deep Neural Network Strong Generalization Visual Perspective Generalization Bound Generalization Error Model Generalization

January 25, 2022

Model Generalization in Arrival Runway Occupancy Time Prediction by Feature Equivalences
An-Dan Nguyen, Duc-Thinh Pham, Nimrod Lilith, Sameer Alam
Model Generalization Real Time Prediction International Airport Tree Based Machine Learning

January 24, 2022

Debiasing pipeline improves deep learning model generalization for X-ray based lung nodule detection
Michael Horry, Subrata Chakraborty, Biswajeet Pradhan, Manoranjan Paul, Jing Zhu, Hui Wen Loh, Prabal Datta Barua, U. Rajendra Arharya
X Ray Model Generalization Lung Segmentation Nodule Detection Lung Cancer Screening

January 5, 2022

Data-driven Model Generalizability in Crosslinguistic Low-resource Morphological Segmentation
Zoey Liu, Emily Prud'hommeaux
Low Resource Language Model Generalization Model Evaluation Model Generalizability Lexical Overlap Morphological Task

November 12, 2021

STFL: A Temporal-Spatial Federated Learning Framework for Graph Neural Networks
Guannan Lou, Yuze Liu, Tiehua Zhang, Xi Zheng
Graph Neural Network Graph Drawing Model Generalization Temporal Data Learning Framework Graph Prediction

November 3, 2021

Lingua Custodia's participation at the WMT 2021 Machine Translation using Terminologies shared task
Melissa Ailem, Jinghsu Liu, Raheel Qader
Machine Translation Related Task Model Generalization Translation Task Transformer Based Architecture Latin Text Semantic Constraint Token Masking

Model Generalization

Papers

The good, the bad and the ugly sides of data augmentation: An implicit spectral regularization perspective

Ensemble Machine Learning Model Trained on a New Synthesized Dataset Generalizes Well for Stress Prediction Using Wearable Devices

Self-Optimizing Feature Transformation

R\'{e}nyi Divergence Deep Mutual Learning

DiscrimLoss: A Universal Loss for Hard Samples and Incorrect Samples Discrimination

Model Generalization: A Sharpness Aware Optimization Perspective

Eliciting and Learning with Soft Labels from Every Annotator

Object Detection, Recognition, Deep Learning, and the Universal Law of Generalization

Effective Abstract Reasoning with Dual-Contrast Network

ER-Test: Evaluating Explanation Regularization Methods for Language Models

Towards Model Generalization for Monocular 3D Object Detection

Towards Generalizable Semantic Product Search by Text Similarity Pre-training on Search Click Logs

Augmentation based unsupervised domain adaptation

Penalizing Gradient Norm for Efficiently Improving Generalization in Deep Learning

With Greater Distance Comes Worse Performance: On the Perspective of Layer Utilization and Model Generalization

Model Generalization in Arrival Runway Occupancy Time Prediction by Feature Equivalences

Debiasing pipeline improves deep learning model generalization for X-ray based lung nodule detection

Data-driven Model Generalizability in Crosslinguistic Low-resource Morphological Segmentation

STFL: A Temporal-Spatial Federated Learning Framework for Graph Neural Networks

Lingua Custodia's participation at the WMT 2021 Machine Translation using Terminologies shared task