Generalization Error

Generalization error, the difference between a model's performance on training and unseen data, is a central challenge in machine learning. Current research focuses on understanding and mitigating this error across various model architectures, including linear models, neural networks (especially deep and overparameterized ones), and graph neural networks, often employing techniques like stochastic gradient descent, early stopping, and ensemble methods such as bagging. This research aims to develop tighter theoretical bounds on generalization error and improve model selection and assessment, particularly under conditions like data scarcity, distribution shifts, and adversarial attacks. Improved understanding of generalization error is crucial for building more reliable and robust machine learning systems across diverse applications.

Papers

October 24, 2022

A PAC-Bayesian Generalization Bound for Equivariant Networks
Arash Behboodi, Gabriele Cesa, Taco Cohen
Generalization Error Inter Part Equivariance Equivariant Network PAC Bayesian Generalization Bound Group Representation

October 15, 2022

How Does Pseudo-Labeling Affect the Generalization Error of the Semi-Supervised Gibbs Algorithm?
Haiyun He, Gholamali Aminian, Yuheng Bu, Miguel Rodrigues, Vincent Y. F. Tan
Semi Supervised Learning Pseudo Labeling Generalization Error Gibbs Algorithm Pseudo Labeled

October 3, 2022

Information-Theoretic Analysis of Unsupervised Domain Adaptation
Ziqiao Wang, Yongyi Mao
Domain Adaptation Strong Generalization Unsupervised Domain Adaptation Generalization Error Tighter Bound

October 2, 2022

Learning Algorithm Generalization Error Bounds via Auxiliary Distributions
Gholamali Aminian, Saeed Masiha, Laura Toni, Miguel R. D. Rodrigues
Generalization Error Upper Bound Generalization Error Bound Tighter Bound R\'enyi Divergence

September 4, 2022

Beyond Random Split for Assessing Statistical Model Performance
Carlos Catania, Jorge Guerra, Juan Manuel Romero, Gabriel Caffaratti, Martin Marchetta
Decision Tree Generalization Performance Model Performance Generalization Error Splitting Algorithm Optimal Split

August 23, 2022

The Value of Out-of-Distribution Data
Ashwin De Silva, Rahul Ramesh, Carey E. Priebe, Pratik Chaudhari, Joshua T. Vogelstein
Deep Network Distribution Data Generalization Error Net Present Value Distribution Sample Provable Generalization

July 19, 2022

Bounding generalization error with input compression: An empirical study with infinite-width networks
Angus Galloway, Anna Golubeva, Mahmoud Salem, Mihai Nica, Yani Ioannou, Graham W. Taylor
Deep Neural Network Empirical Study Generalization Error DNN Architecture Generalization Error Bound Infinite Width Neural Network Width Network Input Compression

July 15, 2022

Error analysis for deep neural network approximations of parametric hyperbolic conservation laws
Tim De Ryck, Siddhartha Mishra
Neural Network Generalization Error Numerical Experiment Conservation Law Error Analysis Approximation Error Deep Neural Network Approximation

July 12, 2022

July 7, 2022

Learning and generalization of one-hidden-layer neural networks, going beyond standard Gaussian data
Hongkang Li, Shuai Zhang, Meng Wang
Neural Network LeArning Abstract Strong Generalization Generalization Error Gaussian Mixture Model Learning Problem Gaussian Data

June 21, 2022

f-divergences and their applications in lossy compression and bounding generalization error
Saeed Masiha, Amin Gohari, Mohammad Hossein Yassaee
Financial Application Mutual Information Generalization Error Lossy Compression Rate Distortion Rate Distortion Function F$ Divergence

June 6, 2022

Rate-Distortion Theoretic Bounds on Generalization Error for Distributed Learning
Milad Sefidgaran, Romain Chor, Abdellatif Zaidi
Generalization Error Learning Algorithm Distributed Learning Rate Distortion Generalization Error Bound

May 28, 2022

Tuning Frequency Bias in Neural Network Training with Nonuniform Data
Annan Yu, Yunan Yang, Alex Townsend
Neural Network Neural Tangent Kernel Generalization Error Non Uniform Frequency Bias

May 26, 2022

May 15, 2022

A Note on the Chernoff Bound for Random Variables in the Unit Interval
Andrew Y. K. Foong, Wessel P. Bruinsma, David R. Burt
Generalization Error Statistical Learning Theory Time Interval Random Variable Binary Classification Loss

May 6, 2022

Fast Rate Generalization Error Bounds: Variations on a Theme
Xuetong Wu, Jonathan H. Manton, Uwe Aickelin, Jingge Zhu
Learning Rate Generalization Error Information Theoretic Category Wise Variation Thematic Analysis

March 14, 2022

Asymptotic Behavior of Bayesian Generalization Error in Multinomial Mixtures
Takumi Watanabe, Sumio Watanabe
Generalization Error Fisher Information Canonical Threshold Asymptotic Behavior Singular Learning Multinomial Mixture