Easy to Hard Generalization

Easy-to-hard generalization in machine learning focuses on training models to perform well on complex tasks using only simpler, easier-to-label training data. Current research investigates this phenomenon across various architectures, including large language models (LLMs) and convolutional neural networks (CNNs), exploring techniques like multi-teacher distillation, instruction-based editing, and prompting strategies such as least-to-most prompting to improve generalization. This research is crucial for advancing AI capabilities beyond human-level supervision and for developing more efficient and robust machine learning systems across diverse applications. The ability to generalize from easy to hard tasks directly impacts the scalability and cost-effectiveness of training advanced AI models.

Papers

October 7, 2022

Achieving and Understanding Out-of-Distribution Generalization in Systematic Reasoning in Small-Scale Transformers
Andrew J. Nam, Mustafa Abdool, Trevor Maxfield, James L. McClelland
Transformer Based Distribution Generalization Step by Step Reasoning Transformer Based Large Language Model Systematic Generalization Easy to Hard Generalization Tiny Transformer

July 5, 2022

Neural Networks and the Chomsky Hierarchy
Grégoire Delétang, Anian Ruoss, Jordi Grau-Moya, Tim Genewein, Li Kevin Wenliang, Elliot Catt, Chris Cundy, Marcus Hutter, Shane Legg, Joel Veness, Pedro A. Ortega
Neural Network Traditional RNNs Neural Network Generalization Easy to Hard Generalization

June 9, 2022

Defending Compositionality in Emergent Languages
Michal Auersperger, Pavel Pecina
Strong Generalization Human Cognition Compositional Language Emergent Language Easy to Hard Generalization Compositional Nature

May 21, 2022

Least-to-Most Prompting Enables Complex Reasoning in Large Language Models
Denny Zhou, Nathanael Schärli, Le Hou, Jason Wei, Nathan Scales, Xuezhi Wang, Dale Schuurmans, Claire Cui, Olivier Bousquet, Quoc Le, Ed Chi
Complex Reasoning Compositional Generalization Easy to Hard Generalization Structured Prompting Language Reasoning Task Compositional Generalization Benchmark

February 23, 2022

UnifiedQA-v2: Stronger Generalization via Broader Cross-Format Training
Daniel Khashabi, Yeganeh Kordi, Hannaneh Hajishirzi
Data Set Transfer Learning Easy to Hard Generalization QA Model

Easy to Hard Generalization

Papers

Achieving and Understanding Out-of-Distribution Generalization in Systematic Reasoning in Small-Scale Transformers

Neural Networks and the Chomsky Hierarchy

Defending Compositionality in Emergent Languages

Least-to-Most Prompting Enables Complex Reasoning in Large Language Models

UnifiedQA-v2: Stronger Generalization via Broader Cross-Format Training