Limited Data

Limited data poses a significant challenge across numerous machine learning applications, hindering the development of accurate and robust models. Current research focuses on mitigating this limitation through techniques like data augmentation, transfer learning (often employing pre-trained models such as transformers and GANs), self-supervised learning, and the incorporation of domain knowledge or other forms of regularization. These advancements are crucial for fields like medical imaging, natural language processing, and robotics, where large, labeled datasets are often unavailable or prohibitively expensive to acquire, enabling progress in applications with limited data availability.

Papers

January 21, 2023

Unpaired Image-to-Image Translation with Limited Data to Reveal Subtle Phenotypes
Anis Bourou, Auguste Genovesio
Limited Data CycleGAN Model Unpaired Image to Image Translation

December 27, 2022

Voice conversion with limited data and limitless data augmentations
Olga Slizovskaia, Jordi Janer, Pritish Chandna, Oscar Mayor
Data Augmentation Voice Conversion Limited Data Voice Transition

December 16, 2022

One-shot skill assessment in high-stakes domains with limited data via meta learning
Erim Yanik, Steven Schwaitzberg, Gene Yang, Xavier Intes, Jack Norfleet, Matthew Hackett, Suvranu De
Deep Learning Domain Adaptation Limited Data Competency Assessment Training Domain Skill Representation High Risk Domain Skill Assessment

December 9, 2022

PDE-LEARN: Using Deep Learning to Discover Partial Differential Equations from Noisy, Limited Data
Robert Stephany, Christopher Earls
Deep Learning Industrial Disturbing Noise Partial Differential Equation Limited Data PDE Solver

November 27, 2022

November 6, 2022

Unlearning Graph Classifiers with Limited Data Resources
Chao Pan, Eli Chien, Olgica Milenkovic
Machine Unlearning Unlearning Framework Limited Data Training Graph Scattering Network Graph Unlearning

November 3, 2022

Physics-informed neural networks for gravity currents reconstruction from limited data
Mickaël Delcey, Yoann Cheny, Sébastien Kiesgen de Richter
Physic Informed Neural Network Limited Data Flow Field Flow Reconstruction Unsteady Flow

October 28, 2022

Latent Space is Feature Space: Regularization Term for GANs Training on Limited Dataset
Pengwei Wang
Generative Adversarial Network Latent Space GAN Model Limited Data Feature Space GAN Training GAN Based Regularization Term

October 27, 2022

ScoreMix: A Scalable Augmentation Strategy for Training GANs with Limited Data
Jie Cao, Mandi Luo, Junchi Yu, Ming-Hsuan Yang, Ran He
Generative Adversarial Network Limited Data GAN Training Effective Augmentation Score Estimation Network

October 16, 2022

Data-Efficient Pipeline for Offline Reinforcement Learning with Limited Data
Allen Nie, Yannis Flet-Berliac, Deon R. Jordan, William Steenbergen, Emma Brunskill
Offline Reinforcement Learning Hyperparameter Optimization Limited Data Efficient Pipeline Hyperparameter Selection

October 15, 2022

Modular machine learning-based elastoplasticity: generalization in the context of limited data
Jan N. Fuhg, Craig M. Hamel, Kyle Johnson, Reese Jones, Nikolaos Bouklas
Strong Generalization Context Information Limited Data Finite Element Constitutive Model Solid Mechanic Synthetic Image Data Real World Material Discovery

October 11, 2022

FreGAN: Exploiting Frequency Components for Training GANs under Limited Data
Mengping Yang, Zhe Wang, Ziqiu Chi, Yanbing Zhang
GAN Model Limited Data GAN Training Low Frequency High Quality Generation Frequency Component

August 30, 2022

Deep Generative Modeling on Limited Data with Regularization by Nontransferable Pre-trained Models
Yong Zhong, Hongtao Liu, Xiaodong Liu, Fan Bao, Weiran Shen, Chongxuan Li
Pre Trained Generative Modeling Limited Data Deep Generative Model Bias Variance

July 25, 2022

Equivariance and Invariance Inductive Bias for Learning from Insufficient Data
Tan Wang, Qianru Sun, Sugiri Pranata, Karlekar Jayashree, Hanwang Zhang
LeArning Abstract Inter Part Equivariance Limited Data Data Efficient Robust Model Invariant Risk Minimization Invariance Learning Intrinsic Class

July 14, 2022

Attribute Graphs Underlying Molecular Generative Models: Path to Learning with Limited Data
Samuel C. Hoffman, Payel Das, Karthikeyan Shanmugam, Kahini Wadhawan, Prasanna Sattigeri
Generative Model Causal Graph Limited Data Root to Leaf Path Structural Causal Generative Autoencoder

June 27, 2022

June 16, 2022

Empirical Bayesian Approaches for Robust Constraint-based Causal Discovery under Insufficient Data
Zijun Cui, Naiyu Yin, Yuru Wang, Qiang Ji
Causal Discovery Limited Data Causal Discovery Method Cause Effect Empirical Bayes Constraint Based Causal Discovery Frequentist Inference

June 15, 2022

Theory of Machine Learning with Limited Data
Marina Sapir
Machine Learning Scientific Inference Theoretical Understanding Limited Data Statistical Learning Theory Contrastive Meta Abduction Method

Limited Data

Papers

Unpaired Image-to-Image Translation with Limited Data to Reveal Subtle Phenotypes

Voice conversion with limited data and limitless data augmentations

One-shot skill assessment in high-stakes domains with limited data via meta learning

PDE-LEARN: Using Deep Learning to Discover Partial Differential Equations from Noisy, Limited Data

CLID: Controlled-Length Image Descriptions with Limited Data

DigGAN: Discriminator gradIent Gap Regularization for GAN Training with Limited Data

Unlearning Graph Classifiers with Limited Data Resources

Physics-informed neural networks for gravity currents reconstruction from limited data

Latent Space is Feature Space: Regularization Term for GANs Training on Limited Dataset

ScoreMix: A Scalable Augmentation Strategy for Training GANs with Limited Data

Data-Efficient Pipeline for Offline Reinforcement Learning with Limited Data

Modular machine learning-based elastoplasticity: generalization in the context of limited data

FreGAN: Exploiting Frequency Components for Training GANs under Limited Data

Deep Generative Modeling on Limited Data with Regularization by Nontransferable Pre-trained Models

Equivariance and Invariance Inductive Bias for Learning from Insufficient Data

Attribute Graphs Underlying Molecular Generative Models: Path to Learning with Limited Data

Wav2Vec-Aug: Improved self-supervised training with limited data

Deep-Learning vs Regression: Prediction of Tourism Flow with Limited Data

Empirical Bayesian Approaches for Robust Constraint-based Causal Discovery under Insufficient Data

Theory of Machine Learning with Limited Data