Compositional Data Augmentation

Compositional data augmentation enhances machine learning models by generating synthetic training data through the combination or modification of existing examples, aiming to improve generalization to unseen compositions of features or concepts. Current research focuses on developing effective augmentation strategies, often leveraging techniques like mixing, substitution (e.g., of image components or text spans), and generative models to create diverse and informative augmented data. This approach addresses limitations of standard models in handling compositional tasks, particularly in areas like natural language processing, computer vision, and semantic parsing, leading to improved performance and robustness in various applications.

11papers

Papers

April 7, 2025

Enhancing Compositional Reasoning in Vision-Language Models with Synthetic Preference Data
Vision Language Model Compositional Reasoning Synthetic Preference Multimodal Large Language Model Compositional Language Vision Language Compositional Data Augmentation

February 28, 2025

Learning to Substitute Components for Compositional Generalization
Compositional Generalization Inductive Bias LeArning Abstract Compositional Generalization Benchmark Compositional Data Augmentation

November 5, 2024

Self-Compositional Data Augmentation for Scientific Keyphrase Generation
Compositional Data Augmentation Keyphrase Generation Training Sample Author Assigned Keyphrases Training Data

October 21, 2024

Scalable Data Ablation Approximations for Language Models through Modular Training and Merging
Training Corpus Data Mixture Language Model Data Deletion Compositional Data Augmentation

January 24, 2024

Do You Guys Want to Dance: Zero-Shot Compositional Human Dance Generation with Multiple Persons
Compositional Data Augmentation Zero Shot Dance Generation

December 18, 2023

The Ultimate Combo: Boosting Adversarial Example Transferability by Composing Data Augmentations
Adversarial Example Weak Augmentation New Combination Adversarial Robustness Augmentation Technique Data Augmentation Compositional Data Augmentation

October 28, 2023

OC-NMN: Object-centric Compositional Neural Module Network for Generative Visual Analogical Reasoning
Visual Reasoning Compositional Data Augmentation Object Centric Representation Reasoning Benchmark

August 13, 2023

Compositional Feature Augmentation for Unbiased Scene Graph Generation
Scene Graph Generation Compositional Data Augmentation Relational Triple Unbiased Scene Graph

June 5, 2023

Learning to Substitute Spans towards Improving Compositional Generalization
LeArning Abstract Inductive Bias Compositional Generalization Compositional Data Augmentation Neural Sequence Model Substitute Span

May 23, 2023

Understanding Compositional Data Augmentation in Typologically Diverse Morphological Inflection
Morphological Inflection Typological Feature Compositional Data Augmentation Morpheme Based

May 12, 2022

TreeMix: Compositional Constituency-based Data Augmentation for Natural Language Understanding
State of the Art Data Language Understanding Compositional Data Augmentation Data Augmentation

May 3, 2022

SUBS: Subtree Substitution for Compositional Semantic Parsing
Compositional Data Augmentation Compositional Split Data Augmentation Compositional Generalization Semantic Parsing

January 30, 2022

Compositionality as Lexical Symmetry
Neural Sequence Model Compositional Language Inductive Bias Compositional Data Augmentation Compositional Model Semantic Parsing

December 14, 2021

Improving Compositional Generalization with Latent Structure and Data Augmentation
Latent Structure Compositional Generalization Compositional Data Augmentation Sequence to Sequence Data Augmentation Compositional Explanation

November 16, 2021

Learning Augmentation Distributions using Transformed Risk Minimization
Risk Minimization Invariant Risk Minimization Learned Model Empirical Risk Minimization Compositional Data Augmentation

Compositional Data Augmentation

Papers

Enhancing Compositional Reasoning in Vision-Language Models with Synthetic Preference Data

Learning to Substitute Components for Compositional Generalization

Self-Compositional Data Augmentation for Scientific Keyphrase Generation

Scalable Data Ablation Approximations for Language Models through Modular Training and Merging

Do You Guys Want to Dance: Zero-Shot Compositional Human Dance Generation with Multiple Persons

The Ultimate Combo: Boosting Adversarial Example Transferability by Composing Data Augmentations

OC-NMN: Object-centric Compositional Neural Module Network for Generative Visual Analogical Reasoning

Compositional Feature Augmentation for Unbiased Scene Graph Generation

Learning to Substitute Spans towards Improving Compositional Generalization

Understanding Compositional Data Augmentation in Typologically Diverse Morphological Inflection

TreeMix: Compositional Constituency-based Data Augmentation for Natural Language Understanding

SUBS: Subtree Substitution for Compositional Semantic Parsing

Compositionality as Lexical Symmetry

Improving Compositional Generalization with Latent Structure and Data Augmentation

Learning Augmentation Distributions using Transformed Risk Minimization